Построение модели на мультиколлинеарность

Тип работы:
Лабораторная работа
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Задание к лабораторной работе 2

На основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области, провести анализ построенной модели на мультиколлинеарность и в случае необходимости устранить мультиколлинеарность.

Исходные данные для анализа

мультиколлинеарность линейный зависимость экономический

Таблица 1 — Значения социально-экономических показателей, характеризующих города и районы Оренбургской области.

Y

X1

X2

X3

X4

X5

716,59

50

0

31,35

2226,11

329,71

4791,44

16,7

355

2,25

135 701,34

2008,04

5677,9

52,9

263

0,11

-8567,61

1458,21

1571,2

45,5

26

0,17

-36 522,68

1821,81

3704,46

40,9

141

0,37

17 280,55

2005,23

3304,59

72,7

173

0,17

-23 702,21

1583,71

4367,39

58,3

43

0,07

2327,56

1283,09

2127,96

52,6

574

0,77

-20 227,66

1556,33

13 657,15

16,7

67

0,15

90 494,93

1543,57

2252,99

55,6

90

0,22

-21 387,79

2376,39

2242,38

81,8

21

0,6

-66 252,5

1855,85

2803,27

42,9

151

2,94

-38 968,18

1780,37

1984,05

41,2

319

1,83

95 392,98

1746,81

3618,35

25

215

0,92

-6880,28

1738,92

2438,19

52,9

50

0,73

-12 601,5

660,66

2074,29

81,2

40

0,08

-19 203,87

1614,86

2172,78

11,1

51

0,12

27 154,79

1479,75

10 893,4

61,9

1468

1,11

-88 359,71

2791,04

5723,31

40,5

998

1,52

53 771,06

2447,89

4967,2

31,2

221

0,07

6046,84

2109,25

20 071,1

31,1

1984

6,9

222 587,21

9987,58

1795,32

17,6

161

0,11

11 834,97

1600,04

3561,15

30,8

110

2,12

5089,93

2466

2217,02

81,8

27

17,11

-4358,73

1663,79

4551,4

14,3

714

2,07

47 042,61

2252,94

3384,8

40

554

0,39

18 636,05

2442,46

3775,83

64,3

739

0,28

-31 576,96

3104,97

2264,2

21,4

55

0,29

12 573,25

2041,39

1047,46

81

238

1,42

-27 755,42

749,79

2833,94

33,3

611

0,23

-41 927,34

992,49

6881,07

55,6

448

0,43

19 211,06

1932,97

1755,21

54,2

163

0,17

2703,44

1623,23

3196,66

50

260

0,14

-1805

2492,35

3649,02

26,3

122

2,09

29 131,25

1848,44

7148,83

100

0

3,86

-70 126,16

2688,39

2784,39

25

1062

10,65

28 860,67

5245,52

4229,97

38,9

3504

0,76

93 608,09

6175,02

61 679,53

27,7

12 002

6,22

8 735 783,87

8125,77

27 338,48

10

8180

0,38

1 526 864,98

7199,35

2012,36

27,3

2192

0,35

27 775,53

7323,76

11 170,01

31,2

4033

2,18

321 986,13

5295,27

29 743,64

39,5

24 413

13,08

1 476 312,51

6902,37

21 460,65

22,3

52 066

26,49

144 294,97

10 336,03

4301,33

28,8

24 492

0,47

710 226,74

6455,67

4401

42,9

1035

0,15

29 769,64

7020,26

3446,14

12,5

879

0,85

40 383,38

7599,74

3539,32

50

4084

0,87

282 356,73

7508,34

Таблица 2 — Наименование показателей.

Обозначение

Наименование

Y

Объем инвестиций в основной капитал на душу населения, рублей

Х1

Удельный вес убыточных предприятий и организаций, в процентах от общего числа предприятий

Х2

Среднегодовая численность работников, занятых в промышленности, человек

Х3

Число зарегистрированных иностранных рабочих, в промилле от численности населения в трудоспособном возрасте

Х4

Сальдированный финансовый результат (прибыль минус убыток) на одно предприятие, рублей

Х5

Объем платных услуг на душу населения, рублей

Мультиколлинеарность

Термин «мультиколлинеарность» используется для обозначения линейной зависимости или корреляции между двумя и более объясняющими переменными.

Различают полную и частичную мультиколлинеарность.

Если существует функциональная линейная зависимость между объясняющими переменными, то говорят, что существует полная мультиколлинеарность.

Реальная или частичная мультиколлинеарность возникает в случаях существования достаточно тесных линейных статических связей между объясняющими переменными.

Признаки мультиколлинеарности.

Внешние признаки:

1. Неоправданно большие с экономической точки зрения коэффициенты уравнения регрессии.

2. Небольшие изменения исходных статистических данных приводит к существенному изменению оценок коэффициентов моделей.

3. Неправильные с экономической точки зрения знаки отдельных коэффициентов регрессии.

4. Среди коэффициентов уравнения регрессии много незначимых, хотя сама модель значима.

5. Стандартные ошибки коэффициентов велики настолько, что сравнимы или даже превосходят сами коэффициенты.

6. Доверительные интервалы для коэффициентов уравнения регрессии содержат внутри себя точку 0.

Данные признаки являются необходимыми, но недостаточными.

Формальные признаки:

1. Среди оценок коэффициентов парной корреляции между объясняющими переменными есть такие, которые по абсолютной величине превосходят значение 0,6.

2. Среди оценок коэффициентов детерминации между одной объясняющей переменной и всеми остальными есть такие, которые больше 0,6.

3. Необходимым условием плохой обусловленности является маленькое значение определителя матрицы Хт*Х.

4. Достаточным условием плохой обусловленности является высокое значение числа обусловленности.

Наиболее простой способ устранения мультиколлинеарности построить линейную модель множественной регрессии, исключая незначимые факторы.

Практическая часть

Модель значима, но из пяти коэффициентов при объясняющих переменных значимы только два — при переменных Х4 и Х5.

Исследование модели на наличие мультиколлинеарности опирается на проверку наличия у модели внешних и формальных признаков.

Итак:

1. У коэффициента Х1 отрицательный знак, что с экономической точки зрения неправильно.

2. Три из пяти коэффициентов незначимы, хотя сама модель значима (рисунок 1).

3. Стандартные ошибки коэффициентов велики настолько, что превосходят сами коэффициенты (рисунок 1).

Рисунок 1 — Внешние признаки наличия мультиколлинеарности

Проанализируем оценку матрицы парных коэффициентов корреляции между объясняющими переменными. Считается, что наличие значимых коэффициентов корреляции, по абсолютной величине превосходящих 0,6, свидетельствует о присутствии мультиколлинеарности.

Для вычисления оценки матрицы парных коэффициентов корреляции в GRETL выбираем пункт Корелляционная матрица. После того, как все 5 объясняющих признака будут перенесены в список выбранных переменных, открываем окно для вычисления оценки матрицы парных коэффициентов корреляции (рисунок 2).

Коэффициенты корреляции, наблюдения 1 — 47 5% критические значения (двухсторонние) = 0,2876 для n = 47

X1

X2

X3

X4

X5

1,0000

-0,2241

0,0125

-0,1731

-0,3529

X1

1,0000

0,5108

0,2574

0,6122

X2

1,0000

0,1000

0,2336

X3

1,0000

0,3782

X4

1,0000

X5

Рисунок 2 — Окно для вычисления оценки матрицы парных коэффициентов корреляции

Как видно из рисунка 2, между объясняющими переменными Х2 и Х5 наблюдается тесная связь. Это один из признаков мультиколлинеарности.

Таким образом, можно сделать вывод, что перечисленные ранее проблемы, связанные с незначимыми коэффициентами, неверными знаками коэффициентов являются следствием мультиколлинеарности.

Мультиколлинеарность будем устранять построением линейной модели множественной регрессии на основе только значимых коэффициентов (рисунок 3).

Модель 2: МНК, использованы наблюдения 1−47 Зависимая переменная: Y

Коэффициент

Ст. ошибка

t-статистика

P-значение

const

1540,23

1041,34

1,4791

0,14 624

X4

0,621 106

0,532 336

11,6676

< 0,1

***

X5

1,6 739

0,260 773

4,0932

0,18

***

Среднее зав. перемен

6921,888

Ст. откл. зав. перемен

10 415,57

Сумма кв. остатков

8,30e+08

Ст. ошибка модели

4343,167

R-квадрат

0,833 681

Испр. R-квадрат

0,826 121

F (2, 44)

110,2759

Р-значение (F)

7,26e-18

Лог. правдоподобие

-458,8290

Крит. Акаике

923,6580

Крит. Шварца

929,2084

Крит. Хеннана-Куинна

925,7466

Рисунок 3 — ЛММР на основе значимых коэффициентов

Получаем следующую оценку модели регрессии:

(1041,34) (0,0005) (0,26)

Проверка подтвердила нормальный характер распределения регрессионных остатков модели (таблица 1)

Таблица 1 — Результаты проверки гипотезы о нормальности регрессионных остатков модели

Критерий

Р-значение

1

Хи-квадрат

0,11

2

Дурника-Хансена

0,11

3

Шапиро-Уилка

0,002

4

Лиллифорса

0

5

Жака-Бера

0,08

Для значимых коэффициентов модели можно построить доверительные интервалы, знание которых позволит получить больше информации о диапазоне влияния исследуемых факторов на результативный показатель — Объем инвестиций в основной капитал на душу населения.

Доверительный интервал имеет вид:

,

Где — оценка коэффициента

— стандартная ошибка оценки коэффициента

— 100%-я точка или квантиль уровня г распределения Стьюдента.

Для построения доверительных интервалов нам понадобится tкрит, найденное для числа степеней свободы v=n-k-1=47−2-1=44, тогда tкрит=2,015.

Доверительный интервал для коэффициентов при Х4: 0,49 925?в4?0,70 075

Доверительный интервал для коэффициентов при Х5: 0,5401?в5?1,5879

Интерпретация результатов

Модель регрессии значима, коэффициенты при всех переменных также значимы. Коэффициент детерминации составил 0,83, т. е. 83% вариации объема инвестиций в основной капитал на душу населения можно объяснить сальдированным финансовым результатом на одно предприятие и объемом платных услуг на душу населения, а 17% вариации, вероятно, объясняется неучтенными в модели факторами.

Анализируя отношение результативного и факторных признаков, можем сказать, что при увеличении на 1 единицу сальдированного финансового результата (прибыль минус убыток) на одно предприятие (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 0,006 единиц; а при увеличении на 1 единицу объема платных услуг на душу населения (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 1,064 единиц.

ПоказатьСвернуть
Заполнить форму текущей работой