загрузка...
 
10.5. Методи аналізу взаємозв’язків
Повернутись до змісту

10.5. Методи аналізу взаємозв’язків

 

1. Маємо дані щодо кредитового обороту обласних філій банку та кількості їх клієнтів. Керівництво банку вважає, що між цими показниками існує певна залежність, і хоче знати, як функціонально кредитовий оборот філії залежить від кількості клієнтів банку.  Потрібно перевірити, чи лінійною є залежність між даними показниками, побудувати модель лінійної парної регресії, яка б характеризувала дану залежність, а також:

а) виконати перевірку статистичної значимості оцінок параметрів, знайдених за методом найменших квадратів, та знайти інтервали довіри для параметрів b0,b1;

б) знайти коефіцієнти еластичності, пояснити їх зміст;

в) знайти коефіцієнти кореляції та детермінації, за допомогою знайдених коефіцієнтів описати вплив розглядуваного фактору на результат;

г) виконати перевірку моделі на адекватність;

д) знайти інтервальні прогнози індивідуального значення для будь-якого значення незалежної змінної. 

Для десяти філій маємо зафіксовані значення показників y, x :

 

                                                                                                     Таблиця 10.5.1

Обласні філіїї банку

Кредитовий оборот, млн. грн., у

Чисельність клієнтів банку,  х

1

7,4

6

2

7,2

5

3

8,6

7

4

9,5

8

5

4,6

4

6

7,3

5

7

8,6

7

8

9,8

7

9

7

4

10

4,8

3

 

Розв'язання.

Важливою задачею є вибір раціонального типу регресійної моделі. Конкретна аналітична  форма зв’язку між економічними показниками згідно з простою регресійною моделлю вибирається на підставі змістовного тлумачення цього зв’язку.

Якщо регресійна модель вимірює зв’язок між двома змінними, то кожну пару спостережень над цими змінними можна зобразити у двовимірній системі координат:

 

Рис. 10.5.1. Кореляційне поле точек

 

Аналіз зображеної множини точок дозволяє зробити висновок про наявність лінійного зв’язку між кількістю клієнтів банку та кредитовим оборотом, тобто для характеристики даної залежності варто обрати лінійну функцію.

Нехай залежність між кредитовим оборотом та чисельністю клієнтів банку  описується  простою лінійною моделлю y=?0+?1x+u, де y ? кредитовий оборот; х ?  чисельність клієнтів банку; u – стохастична складова, яка вводиться до моделі з метою врахувати наявність впливу факторів, які не входять до моделі, ?0 ,  ?1 – параметри моделі .

Згідно з гіпотезою про лінійний зв’язок через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться своїми параметрами b0 та b1. Щоб певна пряма адекватно описувала фактичну залежність, необхідно обрати такий метод оцінювання параметрів моделі, щоб відхилення фактичних значень від розрахункових били мінімальними.

У цьому разі мінімізації підлягає сума квадратів відхилень:  Це є сутністю методу найменших квадратів.

Розрахункові значення кредитового обороту можна знайти, скориставшись такою моделлю парної лінійної регресії: =b0+b1x.

Щоб оцінити параметри моделі b0 та b1 методом 1МНК, запишемо систему нормальних рівнянь

          Параметри регресії розраховуються за формулами:

Параметр b1  вказує на скільки одиниць у середньому зміниться у зі зміною х на одиницю, а параметр b0 – чому дорівнює у, якщо х=0 ( при умові, що змінна х може набувати нульових  значень ).

Необхідні розрахунки:

 

Таблиця 10.5.2

Облас-

ні філії банку

 

Креди-товий оборот, млн. грн., у

Чисель-ність клієн-тів банку,  х

х*у

х2

урозр.

(y-y розр.)2

(x-xсер)2

(y-yсер.)2

(x-xсер)

(у-усер)

(yрозр.-yсер.)2

1

7,4

6

44,4

36

7,8705

0,221363

0,16

0,0064

-0,032

0,15249025

2

7,2

5

36

25

6,8943

0,093476

0,36

0,0784

0,168

0,34304449

3

8,6

7

60,2

49

8,8467

0,060871

1,96

1,2544

1,568

1,86786889

4

9,5

8

76

64

9,823

0,104297

5,76

4,0804

4,848

5,489649

5

4,6

4

18,4

16

5,918

1,73721

2,56

8,2944

4,608

2,439844

6

7,3

5

36,5

25

6,8943

0,164623

0,36

0,0324

0,108

0,34304449

7

8,6

7

60,2

49

8,8467

0,060871

1,96

1,2544

1,568

1,86786889

8

9,8

7

68,6

49

8,8467

0,90874

1,96

5,3824

3,248

1,86786889

9

7

4

28

16

5,918

1,170653

2,56

0,2304

0,768

2,439844

10

4,8

3

14,4

9

4,9418

0,020108

6,76

7,1824

6,968

6,44245924

Сума

74,8

56

442,7

338

 

4,542213

24,4

27,796

23,82

23,25398214

Маємо:                     

Модель лінійної парної регресії має вигляд: у=0,98х+2. Оскільки вільний член b0=2?0, то величина кредитового обороту не є строго пропорційною до кількості клієнтів банку. Кількісна оцінка параметра b1=0,98 показує, що граничне збільшення кредитового обороту при зростанні чисельності клієнтів банку на одного становить 0,98 млн. грн.

Еластичність кредитового обороту щодо кількості клієнтів банку визначається коефіцієнтом еластичності

Значення цього коефіцієнта слід тлумачити так: при збільшенні кількості клієнтів банку на 1% кредитовий оборот гранично зросте на 0,73 %.

Параметри регресії у невеликих за обсягом сукупностях здатні до випадкових коливань. Тому здійснимо перевірку їх істотності або статистичної значимості за допомогою t – критерію Стьюдента:

 

де оцінки дисперсій помилок та параметрів відповідно; значення критерію для кожного з параметрів.

Критичне значення критерію Стьюдента для рівня значимості ?=0,05 (задається дослідником) та n–k=10-2 ступенів вільності ( k – кількість параметрів ) знаходимо за допомогою таблиць t – розподілу Стьюдента. Оскільки tкр .< tфак. , то коефіцієнт регресії вважається статистично значимим, тобто з ймовірністю 0, 95 вплив чисельності клієнтів банку на кредитовий оборот визнається істотним.

 Для перетину b0 критичне значення більше  фактичного значення критерію Стьюдента, тобто оцінка перетину статистично не значима.

Для того, щоб визначити, як оцінки параметрів  пов’язані з параметрами, потрібно побудувати інтервали довіри для параметрів узагальненої регресійної моделі, тобто інтервали в які з заданою ймовірністю потрапляють їхні оцінки.

Довірчі межі коефіцієнта регресії:

зі ймовірністю 0,95.

Довірчі межі вільного члена:  зі ймовірністю 0,95.

Щоб відповісти на питання наскільки значним є вплив змінної х на у, знайдемо значення коефіцієнта кореляції, значення якого знаходиться між –1 та +1:

Значення лінійного коефіцієнта кореляції  0,91 близьке до одиниці, тому можна зробити висновок про досить тісний прямий ( r >0 ) зв’язок між кількістю клієнтів банку та величиною кредитового обороту.

Загальну дисперсію результативної ознаки можна розкласти на дві частини –дисперсію, що пояснює регресію, та дисперсію помилок:

Поділивши обидві частини на загальну дисперсію, отримаємо:

Перша частина цього виразу являє собою частину дисперсії, яку не можна пояснити через регресійний зв’язок, друга – частину дисперсії, яку можна пояснити, виходячи з регресії. Вона називається коефіцієнтом детермінації і використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної:

Постільки значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна тобто зв’язок між кредитовим оборотом та чисельністю клієнтів банку істотний. ( ).

Інший критерій істотності зв’язку – критерій Фішера. Він використовується найчастіше і дає відповідь на питання щодо адекватності моделі, коли значення коефіцієнта детермінації має не явно виражене граничне значення, наприклад, 0,5: 0,45: 0,44 і ін.

Перевірка моделі на адекватність за F – критерієм Фішера складається з таких етапів:

Розраховуємо величину  F – критерію:

      В цій формулі  n, k –  кількість спостережень та кількість параметрів відповідно.

Задаємо рівень значимості, наприклад, ?=0,05. Тобто, ми вважаємо, що можлива помилка для нас становить 0,05, це означає, що ми можемо помилитися не більш, ніж у 5% випадків, а в 95% випадків наші висновки будуть правильними.

На цьому етапі за статистичними таблицями  F – розподілу Фішера з ( k-1, n-k) ступенями вільності та рівнем значимості 100(1-?)% знаходимо критичне значення : Fкр=5,32,

Оскільки, Fкр

  За даними про рівень ефективності економіки та надійність ділового партнерства для семи країн східної Європи оцінити щільність зв’язку між цими ознаками.

Таблиця 10.5.3

 

Країна

A

B

C

D

K

M

P

Інтегральні показники

Ефективність економіки ( max = 10 )

5,9

7,1

4,2

3,4

4,9

2,7

2,9

Надійність ділового партнерства

( max = 100 )

54,9

54,8

45,3

36,9

35,8

26,4

24,8

 

Розв’язання.

Для оцінки щільності зв'язку між ознаками порядкової (рангової) шкали використовують коефіцієнт рангової кореляції r , який за змістом ідентичний лінійному коефіцієнту кореляції. Найбільш поширена формула Спірмена:

,

 де dj — відхилення рангів факторної (Rx) та результативної (Ry) ознак; n — кількість рангів.

Визначимо для кожної країни значення рангів таким чином, щоб ранг країни з найменшим значенням показника був присвоєний найнижчий ранг і т. д. В нашому випадку сума квадратів відхилень рангів становить , а коефіцієнт рангової кореляції:

 

Таблиця 10.5.4

Країна

Інтегральні показники.

Ранги показників

Відхилення рангів, dj

Ефективності економіки (max = 10 )

Надійності ділового партнерства (mах = 100 )

Rx

Ry

А

5,9

54,9

6

7

1

1

В

7,1

54,8

7

6

1

1

С

4,2

45,3

4

5

-1

1

D

3,4

36,9

3

4

-1

1

К

4,9

35,8

5

3

2

4

М

2,7

26,4

1

2

-1

1

Р

2,9

24,8

2

1

1

1

Разом

-

-

-

-

0

10

Значення коефіцієнта рангової кореляції свідчить про наявність прямого і досить помітного зв'язку між зазначеними параметрами ризику іноземного інвестування економіки. Критичне значення коефіцієнта рангової кореляції для ? =0,05 та n=7 становить , що значно менше фактичного. Отже, істотність зв'язку доведена з імовірністю 0,95.

3. За даними опитування 200 інвесторів побудовано комбінаційний розподіл респондентів за віком та схильністю до ризику. До групи ризикових віднесено респондентів, які мають намір придбати цінні папери, незважаючи на ризик, обережні не уявляють ризику без гарантій, не ризикові уникають ризику взагалі.

 

Таблиця 10.5.5

Вік, років

Тип інвестора

Разом

Ризиковий

Обережний

Не ризиковий

До 30

24

12

4

40

30 – 50

20

50

30

100

50 і старші

6

18

36

60

Разом

50

80

70

200

Проаналізувати комбінаційний розподіл робітників, оцінити щільність зв’язку між віком інвесторів та схильністю до ризику за допомогою коефіцієнта взаємної спряженості. Перевірити істотність зв’язку з імовірністю 0,95, зробити висновок.

Розв’язання.

Концентрація частот навколо діагоналі з верхнього лівого кута у правий нижній свідчить про наявність стохастичного зв’язку.

Для оцінки щільності зв’язку обчислимо коефіцієнт спряженості Чупрова, тому що кількість груп за факторною ознакою – віком та результативною – тип інвестора щодо схильності до ризику однакова: mx=3, my=3. Обчислимо значення квадратичної спряженості Пірсона :

Фактичне значення показника значно перевищує критичне, яке ми знайдемо за таблицями для заданої імовірності 0,95 та числа ступенів свободи

k = ( mx – 1 )( my – 1 ) = ( 3 – 1 )( 3 – 1 ) = 4  Отже, істотність зв’язку між віком респондентів та схильністю їх до ризику доведена з імовірністю 0,95.

Коефіцієнт взаємної спряженості:  тобто зв’язок між ознаками помірний.



загрузка...