загрузка...
 
7. Методи аналізу взаємозв’язків 7.1.Поняття про кореляційний аналіз
Повернутись до змісту

7. Методи аналізу взаємозв’язків 7.1.Поняття про кореляційний аналіз

 

Усі явища навколишнього світу, соціально-економічні зокрема, взаємозв’язані й взаємозумовлені. У складному переплетенні, всеохоплюючого взаємозв’язку будь-яке явище є наслідком дії певної множини причин і водночас ? причиною інших явищ. Причини та наслідки пов’язані неперервними ланцюгами прямо або  опосередковано.

Поряд із причинними існують зв’язки паралельних явищ, на які впливає спільна причина.

Визначальна мета вимірювання   взаємозв’язків  ?   виявити   і дати     кількісну    характеристику    причинних зв’язків. Суть причинного зв’язку полягає в тому, що за певних умов одне явище спричи­нює інше. Причина сама по собі не   визначає   наслідку,   останній залежить також від умов, в яких діє причина. Вивчаючи закономірності  зв’язку,  причини та умови об’єднують в одне поняття „фак­тор”. Відповідно ознаки, що характеризують причини та умови зв’язку, називаються факторними x, а ті, що характеризують наслідки зв’язку, - результативними у. Між ознаками х та у виникають різні за природою та характером зв’язки, зокрема: функціональні та стохастичні. При функціональному зв’язку кожному значенню ознаки х відповідає одне чітко визначене значення у. Цей зв’язок виявляється однозначно у кожному окремому випадку. На відміну від функціональних, стохастичні зв’язки неоднозначні. При стохастичному зв’язку кожному значенню ознаки х відповідає певна множина значень у, які утворюють так званий умовний розподіл. Як закон цей зв’язок проявляється лише у масі випадків і характеризується зміною умовних розподілів у. Якщо замінити умовний розподіл середньою величиною , то утвориться різновид стохастичного зв’язку ? кореляційний. У випадку кореляційного зв’язку кожному значенню ознаки х відповідає середнє значення результативної ознаки .Прикладом стохастичного та зокрема кореляційного зв’язку є розподіл проданих на біржі нерухомості однокімнатних квартир за їх вартістю у та розміром загальної площі х (табл. 7.1.1)

Таблиця 7.1.1

 

Розмір загальної площі, м2 , x

Кількість квартир з вартістю, тис. ум. гр. од.

Середня вартість квартири,

тис. ум. гр. од.

9-11

11-13

13-15

15-17

17-19

Разом

До 25

26

12

-

-

-

40

10,8

25—30

4

9

12

5

-

30

13,2

30—35

-

4

6

10

4

24

15,2

35 і більше

-

-

-

-

6

6

18,0

В цілому

30

25

20

15

10

100

13,0

 

Кожній групі за факторною ознакою відповідає свій розподіл у, який відрізняється від інших груп та від безумовного підсумкового розподілу. Отже, спостерігається стохастичний зв’язок між ознаками.

Умовні розподіли можна замінити середніми значеннями результативної ознаки, які обчислюються як середня арифметична зважена:

.

Поступова зміна середніх  від однієї групи до іншої свідчить про наявність кореляційного зв’язку між ознаками.

Характеристикою кореляційного зв’язку є лінія регресії, яка розглядається у двох моделях: аналітичного групування та регресійного аналізу. У моделі аналітичного групування - це емпірична лінія регресії, що утворюється з групових середніх значень результативної ознаки для кожного значення (інтервалу) xj.

Ефекти впливу х на у визначаються як відношення приростів середніх групових значень , де ,.

Оцінка щільності зв’язку ґрунтується на правилі складання дисперсій. У моделі аналітичного групування мірою щільності зв’язку є відношення міжгрупової дисперсії до загальної, яке називають кореляційним відношенням:

,

де  — загальна дисперсія, яка вимірює варіацію результативної ознаки y, зумовлену впливом всіх можливих факторів, міжгрупова дисперсія  ? вимірює варіацію результативної ознаки у за рахунок впливу тільки групувальної ознаки х. Кореляційне відношення коливається від 0 до 1, а якщо подається у процентах, то від 0 до 100%. За відсутнього зв’язку , а за умови функціонального ? . Чим більше  наближається до одиниці, тим щільніший зв’язок.

Проте щільний зв’язок може виникнути випадково, тому необхідно перевірити його істотність, тобто довести невипадковість зв’язку. Перевірка істотності зв’язку – це порівняння фактичного значення h2 з його критичним значенням  для певного рівня істотності ? та числа ступенів свободи k1=m-1 та k2=n-m, де m— число груп; n — обсяг сукупності. Якщо h2>, то зв’язок визнається істотним. Критичні значення кореляційного відношення для ? =0,05 наведені у таблицях.

 

7.2. Коефіцієнт регресії

 

У моделі регресійного аналізу характеристикою кореляційного зв’язку є теоретична лінія регресії, що описується функцією y=f(x), яка називається рівнянням регресії.

На відміну від емпіричної, теоретична лінія регресії неперервна. Рівняння регресії в такому вигляді описує числове співвідношення варіації ознак х та у в середньому. Подаючи у як функцію від х , тим самим абстрагуються від множинності причин, штучно спрощуючи механізм формування варіації у. Аналіз причинних комплексів здійснюється за допомогою множинної регресії.

Різні явища по-різному реагують на зміну факторів. Для того щоб відобразити характерні особливості зв’язку конкретних явищ, статистика використовує різні за функціональним видом регресій ні рівняння. 

Залежно від характеру зв’язку використовують:

лінійні рівняння y=а+bх коли із зміною х ознака у змінюється більш-менш рівномірно;

нелінійні рівняння, коли зміна взаємопов’язаних ознак відбувається нерівномірно (з прискоренням, уповільненням або із змінним напрямком зв’язку), зокрема: степеневе y=ахb, гіперболічне y=а+b/х, параболічне y=а+bх+сх2 тощо.

Вибір та обґрунтування функціонального виду регресії спирається на теоретичний аналіз суті зв’язку. При цьому лише окреслюються особливості форми регресії, але не завжди є можливість визначити її функціональний вид. До того ж у конкретних умовах простору і часу межі варіації взаємопов’язаних ознак значно вужчі за теоретично можливі. Якщо кривизна регресії невелика, то в межах фактичної варіації ознак зв’язок між ними досить точно описується лінійною функцією. Цим пояснюється, що частіше застосовуються лінійні рівняння або приведені до лінійного виду. У лінійному рівнянні параметр b ? коефіцієнт регресії, вказує, на скільки одиниць в середньому зміниться у із зміною х на одиницю. Він має одиницю виміру результативної ознаки. У випадку прямого зв’язку b ? величина додатна, а при зворотному ? від’ємна. Параметр а ? вільний член рівняння регресії, тобто це значення y при x=0. Якщо х не набуває нульових значень, цей параметр має лише розрахункове призначення. Параметри визначаються методом найменших квадратів, згідно з яким сума квадратів відхилень емпіричних значень у від теоретичних  мінімальна: . Відповідно до умови мінімізації параметри обчислюються на основі системи нормальних рівнянь:

,

.

Звідси

 .

Коефіцієнт регресії у невеликих за обсягом сукупностях схильний до випадкових коливань. Тому здійснюється перевірка його істотності за допомогою t ? критерію (Ст’юдента), статистична характеристика якого для гіпотези Н0: b =0 визначається таким чином:, де b ? коефіцієнт регресії, mb ? власне стандартна похибка, що розраховується за формулою

;

де ? відповідно залишкова та факторна дисперсії; n ?обсяг сукупності.

Для коефіцієнта регресії визначаються довірчі межі b ± tµb.

Характеристикою відносної зміни у за рахунок х є коефіцієнт еластичності , який показує, на скільки процентів у середньому змінюється результативна ознака зі зміною факторної на 1%.

На підставі рівняння регресії визначаються теоретичні значення , тобто значення результативної ознаки за умови впливу лише фактора х при незмінному рівні інших факторів.



загрузка...