загрузка...
 
6.4. Обчислення помилок вибірки
Повернутись до змісту

6.4. Обчислення помилок вибірки

 

Всі види відбору (крім механічного) можуть бути повторними і безповторними. Механічний відбір завжди безповторний.

Методи відбору:

1. Безповторний - коли відібрана у вибірку одиниця сукупності не повертається у генеральну і більше у відборі не приймає участі. Тобто збільшується можливість інших одиниць попасти у вибірку.

2. Повторний - коли відібрана у вибірку одиниця сукупності реєструється, повертається у генеральну сукупність і знову може бути відібрана.

Безповторний відбір дає точніші результати порівняно з повторним, оскільки за однакового обсягу вибірки без повторні дослідження охоплюють більше одиниць сукупності, ніж повторні.

Повторний та безповторний методи відбору залежно від характеру відбору одиниць поділяються на три види:

індивідуальний – відбір окремих одиниць сукупності;

груповий (серійний) – відбір груп (серії)одиниць;

комбінований – комбінація індивідуального і групового.

Від основи вибірки залежить спосіб добору елементів сукуп­ності для обстеження.

Для узагальнюючої характеристики похибок вибірки розраховують середню похибку репрезентативності, яку називають стандартною. Стандартна похибка вибірки m є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Розмір похибки залежить від чисельності вибіркової сукупності – чим більше одиниць відібрано, тим менша похибка; від варіації ознаки у генеральній сукупності – чим більша варіація ознаки, тим більша у середньому і похибка вибірки.

Середня помилка власне випадкової та механічної вибірок обчислюється за формулами (таб.6.4.1):

Таблиця 6.4.1

Спосіб відбору

Без повторний відбір

Повторний відбір

Для середнього значення ознаки

Для частки

 

де N ? обсяг сукупності; n ? обсяг вибірки; ?2 – дисперсія генеральна.

Оскільки на практиці генеральна дисперсія нам не відома, то використовують формули для повторної вибірки , для безповторної вибірки  відомі з теорії ймовірностей. Тоді  або .

 

При практичному використанні наведених формул слід враховувати, що:

дисперсія частки , де p i q – частки вибірки, елементам яких відповідно властиве і невластиве дане значення ознаки;

у великих за обсягом сукупностях (30 і більше одиниць) поправка  не вносить істотних змін у розрахунки, а тому враховується лише у малочислених вибірках;

коригуючий множник для безповторної вибірки  при малих величинах  наближається до 1, а тому при 1-5%-ній вибірці розрахунок  ведеться за формулою для повторної вибірки; при 10%-вій вибірці коригуючий множник становить 0, 949, при 20%-вій – 0,894.

Крім стандартної похибки вибірки обчислюють похибку граничну – максимально можливе відхилення вибіркової оцінки від значення параметра в генеральній сукупності для заданої ймовірності F(x).

Гранична похибка вибірки: . Довірче число t вказує, як співвідносяться гранична та стандартна похибки.

Формула граничної похибки випливає з основних положень теорії вибіркового методу.

Однією з головних теорем, покладених в основу теорії вибіркового методу, є теорема П. Л. Чебишева, за допомогою якої він довів, що з ймовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки.

Академік А. А. Марков довів збереження цієї умови для незалежних спостережень. Академік А. М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою

 .

Значення цього інтеграла при різних значеннях t табульовані і наводяться в спеціальних таблицях.

Для , ; для ,  ; для , .

Це означає, що наприклад, з ймовірністю 0,954 можна стверджувати, що похибка репрезентативності вибірки не перевищує ±2? .

Зі збільшенням вибіркової сукупності підвищується точність вибіркових даних. Проте іноді доводиться обмежуватися малою кількістю спостережень. Вибіркову сукупність, яка складається з порівняно невеликої кількості одиниць (20 ... 30), називають малою вибіркою. Математичною статистикою доведено, що й при малих вибірках характеристики вибіркової сукупності можна поширити на генеральну. Проте обчислення середньої та граничної похибок мають свої особливості.

При малих вибірках дисперсію обчислюють з урахуванням кількості ступенів вільності варіації.

Ступенем вільності варіації називають кількість одиниць, здатних змінюватися після того, як для всіх одиниць вибірки було визначено їх загальну характеристику.

Англійський вчений Ст’юдент винайшов закон розподілу відхилень вибіркових середніх від генеральної для малих вибірок. За цим законом він побудував таблиці, в яких наводяться значення критерію t для малих вибірок.

Згідно з розподілом Ст’юдента ймовірна оцінка того, що гранична похибка не перевищить t–кратну середню похибку в малих вибірках, залежить від значення t та кількості ступенів свободи .

У практиці вибіркових спостережень використовують два типи оцінок ? точкові і інтервальні.

Точкова оцінка ? це значення параметра за даними вибірки: вибіркова середня ? та вибіркова частка .

Інтервальна оцінка ? це інтервал значень параметра, розрахований за даними вибірки для певної імовірності.

Межі довірчого інтервалу визначають на основі точкової оцінки та граничної похибки вибірки:

для середньої ;

для частки .

У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї ж самої в різних сукупностях.

Такі порівняння виконують за допомогою відносної похибки, яка показу, на скільки відсотків вибіркова оцінки може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої – це коефіцієнт варіації вибіркових середніх:

.

На практиці достатнім рівнем точності вважається . Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку:

.

 

6.5. Визначення обсягу вибірки і способи поширення вибіркових даних

 

Проектуючи вибіркові обстеження, визначають мінімально достатній обсяг вибірки, за якою вибіркові оцінки репрезентували б основні властивості генеральної сукупності.

Чисельність вибірки залежить від таких факторів:

а) варіації досліджуваної ознаки. Чим більша варіація, тим більшою має бути чисельність вибірки, і навпаки;

b) розміру можливої граничної похибки вибірки. Чим менший розмір можливої похибки, тим більшою має бути чисельність вибірки;

с) значення ймовірності, з якою гарантуватимуть результати вибірки. Чим більша ймовірність, тим більшою має бути чисельність вибірки;

d) способу добору одиниць у вибіркову сукупність.

Для власне випадкової та механічної вибірки при повторному відборі

;

при без повторному ?

.

Для визначення обсягу вибірки n використовують оцінки дисперсій аналогічних пробних обстежень; якщо такі обстеження відсутні, можна скористатися співвідношенням: , а для частки взяти значення дисперсії .

 



загрузка...