загрузка...
 
3.3.2.Визначення числа груп і розміру інтервалу
Повернутись до змісту

3.3.2.Визначення числа груп і розміру інтервалу

 

Якщо групування проводять за атрибутивною, або територіальною, або ознакою часу, то кількість груп, на які поділяється сукупність, визначається кількістю різновидів цих ознак.

Якщо групування проводять за варіаційною ознакою, постає питання щодо кількості груп і величини інтервалів. При цьому керуються законом діалектики переходу кількісних змін у якісні. Чим більше розмах варіації ознаки, тим на більшу кількість груп поділяють сукупність. Якщо сукупність не велика, то її не можна поділяти на велику кількість груп. Оскільки в групах не буде достатньої кількості одиниць сукупності, то характеристики цих груп можуть бути недостатньо типовими.

Якщо значення дискретної кількісної ознаки коливаються у невеликому інтервалі, кількість груп відповідає кількості  різних значень ознаки. Якщо значення дискретної ознаки коливаються в досить широкому діапазоні, або ж в основу групування покладено неперервну ознаку, кількість груп можна визначити за формулою Стерджеса:

, де N – кількість спостережень.

Інтервали являють собою каркас групувань. На практиці їх утворюють за трьома формальними принципами: рівності інтервалів; кратності інтервалів; рівності частот.

У структурних і аналітичних групуваннях найчастіше застосо­вують принцип рівності інтервалів. Ширина кожного інтервалу залежить від діапазону варіації ознаки х та обґрунтованого числа груп (інтервалів).

В цьому випадку величина інтервалу:

,

а межі інтервалів:

,

,

де хні, хві – нижня і верхня межі інтервалів.

Так визначають інтервали групування, коли ознака змінюється більш-менш рівномірно у певних межах, тобто рівні інтервали.

Нерівні інтервали застосовують в аналітичних групуваннях, метою яких є розкриття зв’язку між ознаками. В цьому випадку інтервали вибирають так, щоб число одиниць в утворених групах було достатнім, тобто щоб групи були приблизно однаково заповнені.

Спеціалізовані інтервали використовуються при типологічному групуванні, коли виділяють групи, які відрізняються якісною своєрідністю. В цьому випадку межа встановлюється там, де відбувається перехід від однієї якості до іншої. Межі спеціалізованих інтервалів можуть коливатися в залежності від умов, місця і часу.

Визначаючи межі інтервалів, ширину доцільно округлювати, самі межі слід позначати з такою точністю, щоб поділ елементів сукупності на групи був однозначним.

Якщо діапазон варіації ознаки надто широкий і поділ значень нерівномірний, беруть нерівні інтервали, зокрема сформовані за принципом кратності, коли ширина кожного наступного інтервалу  в k раз більша (менша), ніж попереднього.

Припустимо, що прибутковість активів комерційних банків коливається від 1 до 42%, а прибутковість капіталу ? від 11 до 165 %. За кожною ознакою утворимо чотири групи (п = 4), скориставшись за прибутковістю активів принципом рівних інтервалів, тобто h = (42 ? 1) : 4  10, а за прибутковістю капіталу ? принципом кратності інтервалів (k = 2). Варіанти розбиття на групи ілюструє таблиця 3.2.1.

Таблиця 3.2.1.

Варіанти формування інтервалів групувань за рівнем прибутковості, %

Прибутковість активів

Прибутковість капіталу

До10

11?20

10?20

21?40

20?30

41?80

30 і більше

81 і більше

 

Перший та останній інтервали (або один із них) відкриті, тобто мають лише одну межу (верхню чи нижню). За допомогою виритих інтервалів усі крайні значення ознаки, що варіює, зводяться в одну групу, завдяки чому групування стає компактним. Межі інтервалів визначаються по-різному. У першому варіанті групування верхня ме­жа і-го інтервалу збігається з нижньою межею (і + 1)-го інтерва­лу. Правило віднесення межових значень ознаки до відповідного інтервалу задають слова, що стосуються відкритих інтервалів. Зокрема, слово “до” в першому інтервалі означає, що нижню ме­жу слід уважати належною, а верхню — не належною інтервалу. У другому варіанті групування верхня межа і-го інтервалу і нижня межа (і + 1)-го інтервалу різняться між собою. У цьому разі обидві межі вважаються такими, що належать інтервалу. Інтервали типологічного групування формуються не за мате­матичними принципами, а за соціально-економічним змістом. Межа інтервалу розглядається як умовна межа переходу кількос­ті в нову якість. Число груп залежить від кількості існуючих ти­пів. Наприклад, групуючи чоловіків за ознакою працездатності, застосовують вікові групи, років: 0 — 15 ? особи допрацездатпого віку; 16 — 59 — працездатного; 60 і більше — старші за працездатний вік. Принцип рівних частот використовують нечасто і переважно в аналітичних групуваннях, щоб уникнути зважування групових середніх (дисперсійний аналіз результатів експерименту). Групування за однією ознакою називається простим, за двома і більше ознаками — комбінаційним. У комбінаційних групуваннях ознаки ієрархічно впорядковуються за змістом чи за вагомістю. Групи, утворені за першою ознакою, поділяються на підгрупи за другою, а ті, у свою чергу, можуть поділятися на підгрупи за третьою ознакою і т. д. На кожному етапі поділу використовується лише одна ознака, тобто відбувається послідовне описування груп. Кількість підгруп дорівнює добутку числа групувальних ознак на число градацій за кожною з них. У разі трьох і більше групуваль­них ознак сукупність стрімко подрібнюється, групи виявляються нечисленними, а характеристики груп — ненадійними.

Альтернативою комбінаційному групуванню є багатовимірне, коли групи утворюються за певною множиною ознак одночасно. Мірою подібності елементів є різні критерії і, як наслідок, — різ­ні методи багатовимірного групування. Найпростішим серед них є групування за інтегральним показником, наприклад за рейтинговою оцінкою. У такому разі багатовимірне групування зводиться до простого.

Іноді доводиться перегруповувати дані, передусім щоб забезпечити порівнянність структур двох сукупностей за однією і тією самою ознакою. Результат перегрупування називають вторин­ним групуванням. Перегрупування виконують або об’єднанням, або розбиттям інтервалів первинного групування.

Якщо межі інтервалів первинного і вторинного групувань збігаються, частоти (частки) об’єднувальних інтервалів просто підсумовуються. Коли виконується розбиття інтервалу первинного групування, частоти поділяються між новоутвореними групами пропорційно до співвідношення частин довжини початкового інтервалу. Припускається, що всередині інтервалу поділ рівномірний.

 загрузка...