Основи статистичного аналізу даних. Ряди даних
джерело -
Статистика - (лат status — стан) наука, що вивчає
методи отримання, опрацювання й аналізу даних, які характеризують масові
явища.
1. Статистичні спостереження.
2. Первинне узагальнення і групування статистичних даних.
3. Оцінка об'єкта аналізу.
4. Комп'ютерний аналіз первинних і узагальнених розширених статистичних даних.
5. Комп'ютерне прогнозування за обраними найбільш важливими напрямками.
6. Узагальнений аналіз отриманих результатів та перевірка їх на достовірність за статистичними критеріями.
3. Оцінка об'єкта аналізу.
4. Комп'ютерний аналіз первинних і узагальнених розширених статистичних даних.
5. Комп'ютерне прогнозування за обраними найбільш важливими напрямками.
6. Узагальнений аналіз отриманих результатів та перевірка їх на достовірність за статистичними критеріями.
2. Ряди даних
Для аналізу створюють певну вибірку об’єктів дослідження, тобто з усієї множини об’єктів дослідження відбирають певну кількість і на ній проводять дослідження.
Вибірка (або вибіркова сукупність) — це множина об’єктів, за допомогою певної процедури вибраних із генеральної сукупності для участі в дослідженні.
Варіанта - значення величини у вибірці.
Чим більше така вибірка, тим точніше буде проведено аналіз і зроблено відповідні висновки. Тобто вибірка повинна бути масовою.
Вибірка даних має бути репрезентативною (франц representatif — показовий, характерний, типовий). Дані, отримані з дослідженої вибірки, найчастіше заносять у таблицю. Така форма подання даних з вибірки зручна для їх аналізу та прогнозів. Дані з кожного рядкаі стовпця такої таблиці утворюють ряди даних.
У таблиці подано результати виступів команди учнівства України на міжнародних олімпіадах з інформатики з 2005 по 2017 рік. Тут вибіркою є вказані в таблиці роки, а рядами даних — загальна кількість медалей у ці роки, а також кількість золотих, срібних і бронзових медалей у вказані роки.
Таблиця
Результати виступу команди учнівства України на міжнародних
олімпіадах з інформатики за 2005–2017 роки
3. Дискретний варіаційний ряд
Дискретний ряд - це такий варіаційний ряд, в основу побудови якого покладено ознаки з переривчастою зміною (дискретні ознаки). До останніх можна віднести тарифний розряд, кількість дітей в сім'ї, число працівників на підприємстві і т.д. Ці ознаки можуть приймати лише кінцеве число певних значень.Дискретний варіаційний ряд являє таблицю, яка складається з двох граф. У першій графі вказується конкретне значення ознаки, а в другій - число одиниць сукупності з певним значенням ознаки.
Приклад:
Є список оцінок, отриманих студентами на іспитах: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.
Побудувати дискретний варіаційний ряд.
Розв'язання:
1) Впорядкуємо одиниці спостереження за зростанням досліджуваного значення ознаки:2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.
2) Визначимо всі можливі значення ознаки xi, впорядкуємо їх за зростанням:
У даному прикладі всі оцінки можна розділити на чотири групи з наступними значеннями: 2; 3; 4; 5.
3) Підрахуємо скільки разів зустрічається кожне значення ознаки у досліджуваній сукупності, тобто визначимо частотукожного значення ознаки fi.
У даному прикладі всі оцінки можна розділити на чотири групи з наступними значеннями: 2; 3; 4; 5.
3) Підрахуємо скільки разів зустрічається кожне значення ознаки у досліджуваній сукупності, тобто визначимо частотукожного значення ознаки fi.
Частота - число, що показує, скільки разів зустрічається кожна варіанта.
Відносна частота - відношення частоти випадків даного значення до загальної суми частот.
Сума всіх частот ряду дорівнює кількості елементів у досліджуваній сукупності.
Для нашого прикладу:
- оцінка 2 зустрічається - 8 разів,
- оцінка 3 зустрічається - 12 разів,
- оцінка 4 зустрічається - 23 рази,
- оцінка 5 зустрічається - 17 разів.
Всього 60 оцінок.
З метою створення візуального відображення статистичної інформації користуються різними графіками. Найпоширеніші види графічного відображення статистичної інформації — полігони частот. Графічне зображення варіаційних рядів за допомогою полігона допомагає отримати наочне уявлення про закономірності про можливі зміни спостережуваних значень.
Полігон, як правило, використовують для відображення дискретного варіаційного ряду.
Алгоритм побудови інтервального варіаційного ряду:
4) підрахувати число даних, що потрапили в кожний з інтервалів.
Необхідно побудувати інтервальний варіаційний ряд, поділивши дані на шість рівних інтервалів.
- оцінка 2 зустрічається - 8 разів,
- оцінка 3 зустрічається - 12 разів,
- оцінка 4 зустрічається - 23 рази,
- оцінка 5 зустрічається - 17 разів.
Всього 60 оцінок.
4) Запишемо отримані дані в таблицю з двох рядків (стовпців) - xі і fi.
На підставі цих даних побудуємо дискретний варіаційний ряд:
На підставі цих даних побудуємо дискретний варіаційний ряд:
Полігон, як правило, використовують для відображення дискретного варіаційного ряду.
Приклад:
Навчальні досягнення учнів деякого класу з інформатики характеризуються даними, наведеними у таблиці:
Кількість балів x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Число учнів n | 1 | 1 | 2 | 3 | 4 | 4 | 6 | 5 | 3 | 3 | 2 | 1 |
Побудувати полігон частот.
Розв'язання:
Будуємо точки, спираючись на дані з таблиці. Отримані точки з'єднуємо відрізками. Зверніть увагу на точки (0; 0) та (13; 0), що розташовані на осі абсцис і мають своїми абсциссами числа, на одиницю менше та більше, ніж відповідно абсциси найлівішої та найправішої точок. Полігон частот виглядатиме наступним чином:
4. Інтервальний варіаційний ряд
Якщо ознака має безперервну зміну (розмір доходу, стаж роботи, вартість основних фондів підприємства і т.д., які в певних межах можуть приймати будь-які значення), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд.
Групова таблиця тут також має дві графи. У першій вказується значення ознаки в інтервалі «від - до» (варіанти), у другій - число одиниць, що входять до інтервалу (частота).
Частота - число повторень окремого випадку значень ознаки, позначається fi, а сума частот, що дорівнює обсягу досліджуваної сукупності, позначається
де k - число варіантів значень вибірки.
Алгоритм побудови інтервального варіаційного ряду:
1) визначити кількість інтервалів для побудови інтервального варіаційного ряду;
2) знайти ширину інтервалу (крок) h = (xmax - xmin) / k, де k - число варіантів значень вибірки;
3) визначити межі кожного інтервалу в порядку зростання;2) знайти ширину інтервалу (крок) h = (xmax - xmin) / k, де k - число варіантів значень вибірки;
4) підрахувати число даних, що потрапили в кожний з інтервалів.
Приклад:
За результатами аналізу вугілля, відібраного безповторним відбором, отримані наступні результати щодо його зольності : 18, 16, 18, 21, 19, 17, 18, 21, 14, 18, 16, 12, 19, 23, 17, 18, 15, 20, 19, 17, 21, 16, 20, 13, 19, 14, 20, 15,18, 20, 17, 19, 16, 18, 13, 15, 17, 24, 16, 14.Необхідно побудувати інтервальний варіаційний ряд, поділивши дані на шість рівних інтервалів.
Розв'язання:
1) k = 6;
2) h = (24 - 12) / 6 = 2;
3) 12 - 14
14 - 16
16 - 18
18 - 20
20 - 22
22 - 24
4) 6; 11; 17; 16; 7; 2.
2. Робота в класі
Завдання 1.
За 22 респондентами є дані про кількість членів в їх сім'ях: 3; 2; 5; 4; 6; 5; 3; 2; 4; 3; 4; 2; 3; 2; 5; 2; 3; 4; 2; 5; 7; 6. Побудуйте дискретний варіаційний ряд.
Завдання 2.
Є дані про величину отриманого прибутку 16 підприємств, млн. грн. - 23; 48; 57; 12; 118; 9; 16; 22; 27; 48; 56; 87; 45; 98; 88; 63. Побудуйте інтервальний варіаційний ряд розподілу підприємств за обсягом прибутку, виділивши 3 групи з рівними інтервалами.
3. Домашнє завдання
Виконайте комп'ютерне тестування: (у випадку перевищення ліміту тестування, скористайтесь посиланням, виділеним синім кольором).
Немає коментарів:
Дописати коментар