Моделирование экономических процессов

Тип работы:
Контрольная
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Исходные данные

Задача 1. Эконометрическое моделирование стоимости квартир в Московской области.

Исследуемые факторы: Y, X1, X2, X4. Номера наблюдений: 41−80.

Наименования показателей

Обозначение

Наименование показателя

Единица измерения (возможные значения)

Y

цена квартиры

тыс. долл.

X1

город области

Подольск/Люберцы

X2

число комнат в квартире

X4

жилая площадь квартиры

кв. м

Исходные данные для эконометрического моделирования стоимости квартир

Y

X1

X2

X4

41.

38

1

1

19

42.

62,2

1

2

36

43.

125

0

3

41

44.

61,1

1

2

34,8

45.

67

0

1

18,7

46.

93

0

2

27,7

47.

118

1

3

59

48.

132

0

3

44

49.

92,5

0

3

56

50.

105

1

4

47

51.

42

1

1

18

52.

125

1

3

44

53.

170

0

4

56

54.

38

0

1

16

55.

130,5

0

4

66

56.

85

0

2

34

57.

98

0

4

43

58.

128

0

4

59,2

59.

85

0

3

50

60.

160

1

3

42

61.

60

0

1

20

62.

41

1

1

14

63.

90

1

4

47

64.

83

0

4

49,5

65.

45

0

1

18,9

66.

39

0

1

18

67.

86,9

0

3

58,7

68.

40

0

1

22

69.

80

0

2

40

70.

227

0

4

91

71.

235

0

4

90

72.

40

1

1

15

73.

67

1

1

18,5

74.

123

1

4

55

75.

100

0

3

37

76.

105

1

3

48

77.

70,3

1

2

34,8

78.

82

1

3

48

79.

280

1

4

85

80.

200

1

4

60

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.

2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

3. Рассчитайте параметры линейной парной регрессии для каждого фактора Х.

4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.

5. Для выбранной модели осуществите прогнозирование среднего значения показателя при уровне значимости, если прогнозное значения фактора составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.

6. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счёт значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.

7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, — и — коэффициентов.

Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда

В течение девяти последовательных недель фиксировался спрос Y (t) (млн. р.) на кредитные ресурсы финансовой компании.

Временной ряд Y (t) этого показателя приведен ниже в таблице.

Номер варианта

Номер наблюдения (t = 1, 2, …, 9)

1

2

3

4

5

6

7

8

9

2

43

47

50

48

54

57

61

59

65

эконометрический моделирование регрессия ряд

Задание.

1. Проверить наличие аномальных наблюдений.

2. Построить линейную модель, параметры которой оценить МНК (- расчетные, смоделированные значения временного ряда).

3. Оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7−3,7).

4. Оценить точность моделей на основе использования средней относительной ошибки аппроксимации.

5. Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р = 70%).

6. Фактические значения показателя, результаты моделирования и прогнозирования представить графически.

Решение

Задача 1.1 Матрица парных коэффициентов корреляции

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.

Парные коэффициенты корреляции рассчитываются по формуле:

,

где n — объем выборки, — значение факторного признака, — значение результативного признака, — среднее значение факторного признака, — среднее значение результативного признака.

Используя инструмент «Корреляция» пакета «Анализ данных» в Excel получим матрицу парных коэффициентов корреляции.

Y

X1

X2

X4

Y

1

X1

-0,1 126

1

X2

0,751 061

-0,0341

1

X4

0,874 012

-0,0798

0,868 524

1

Качественно оценим взаимосвязь между результирующим признаком Y и каждым из факторов Хj, j=1,2,4 (силу зависимости определим по шкале Чеддока):

,

значит, между переменными Y и Х1 наблюдается обратная корреляционная зависимость. Однако зависимость между этими показателями очень слабая.

значит, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше число комнат в квартире, тем выше ее цена.

,

значит, между переменными Y и X4 наблюдается прямая корреляционная зависимость: чем больше жилая площадь квартиры, тем выше ее цена.

эта зависимость высокая, ближе к весьма высокой.

Это означает, что на 87,4 зависимая переменная Y (цена квартиры) зависит от показателя Х4 жилая площадь квартиры.

Оценим теперь статистическую значимость каждого коэффициента. Для этого рассчитаем значения t-критерия Стьюдента для каждого коэффициента.

,

где — парный коэффициент корреляции результативного признака Y и факторного Xj, j=1,2,4, n — объем выборки.

ty, x1 = 0,069

ty, x2 = 7,012

ty, x4 = 11,088

tкр. = (0,05; 38) = 2,024

По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40−2=38 определим критическое значение: tкр = 2. 024

Т.к. (0,069<2. 024), то коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.

Т.к. (7,012>2. 024), то коэффициент является значимым. На основании выборочных данных есть основания утверждать, что зависимость между ценой квартиры Y и числом комнат в квартире Х2 существует.

Т.к. (11,088>2. 024), то коэффициент является значимым (значимо отличается от нуля). На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии тесной линейной корреляционной зависимости между признаками Y и Х4. Зависимость между ценой квартиры Y и жилой площадью квартиры Х4 является достоверной.

Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.

Задача 1.2 Поле корреляции результативного признака

2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

Для построения поля корреляции воспользуемся инструментом «Мастер диаграмм» в Excel. Выберем «Точечную» диаграмму. По оси абсцисс отложим значения фактора, наиболее тесно связанного с результативным фактором (X4), а по оси ординат — сам результативный фактор (Y).

Задача 1.3. Параметры линейной парной регрессии

3. Рассчитайте параметры линейной парной регрессии для каждого фактора Х.

Для построения линейной парной модели

,

j=4,5,6 используем инструмент «Регрессия» пакета «Анализ данных» в Excel.

Входной фактор Х1:

Результаты вычислений представлены в таблицах:

Регрессионная статистика

Множественный R

0,11 259 267

R-квадрат

0,126 771

Нормированный R-квадрат

-0,26 185 682

Стандартная ошибка

58,3 645 994

Наблюдения

40

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

16,22 784 091

16,22 784 091

0,4 817 913

0,945 026 312

Остаток

38

127 992,7659

3368,230 682

Итого

39

128 008,9938

Таким образом, уравнение модели (1) имеете вид:

Коэффициент регрессии ?=-1. 28, следовательно при изменении города области, в среднем на 1. 28 тыс. долл. уменьшается цена квартиры. Свободный член ?= 101. 813 не имеет экономического смысла, но говорит о том, что сначала меняется фактор X1, а потом результат Y.

Оценим значимость каждого коэффициента регрессии:

стандартная ошибка, — расчетное значение.

Расчетные значения t-статистик Стьюдента приведены в таблице:

По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40−2=38 определим критическое значение: tкр = 2. 024

Таким образом, > tкр (8,228>2. 024), следовательно свободный член в уравнении регрессии значим; < tкр (-0. 069<2. 024), следовательно фактор Х1 в уравнении регрессии не значим, т. е. фактор город области не играет решающую роль в формировании цены на квартиру.

Входной фактор X2:

Результаты вычислений представлены в таблицах:

Регрессионная статистика

Множественный R

0,75 106 074

R-квадрат

0,564 092 234

Нормированный R-квадрат

0,552 620 977

Стандартная ошибка

38,32 002 171

Наблюдения

40

Таким образом, уравнение модели (2) имеете вид:

Коэффициент регрессии в=36. 037, следовательно при увеличении числа комнат в квартире на 1, в среднем на 36. 037 тыс. долл. увеличивается цена квартиры. Свободный член б=7. 539 не имеет реального смысла, но показывает, что вначале изменяется фактор X2, а потом результат Y, т. е. относительное изменение результата происходит медленнее, чем изменение фактора.

Оценим значимость каждого коэффициента регрессии:

Таким образом, < tкр (0,514<2. 024), следовательно свободный член в уравнении регрессии не значим; > tкр (7. 012>2. 024), следовательно фактор Х2 в уравнении регрессии значим, т. е. число комнат в квартире значительно влияет на стоимость квартиры.

Входной фактор X4:

Результаты вычислений представлены в таблицах:

Регрессионная статистика

Множественный R

0,874 012 079

R-квадрат

0,763 897 114

Нормированный R-квадрат

0,75 768 388

Стандартная ошибка

28,20 194 696

Наблюдения

40

Таким образом, уравнение модели (3) имеете вид:

Коэффициент регрессии в=2. 476, следовательно при увеличении жилой площади квартиры на 1 кв. м, в среднем на 2. 476 тыс. долл. увеличивается цена квартиры. Свободный член б=-2. 865 не имеет экономического смысла, но показывает, что сначала изменяется результат Y, а потом, фактор X4 т. е. относительное изменение фактора происходит медленнее, чем изменение результата.

Оценим значимость каждого коэффициента регрессии:

Таким образом, < tкр (-0,275<2. 024), следовательно свободный член в уравнении регрессии не значим; > tкр (11. 088>2. 024), следовательно фактор Х4 в уравнении регрессии значим, т. е. фактор жилая площадь квартиры влияет на формирование стоимости квартиры.

Задача 1.4. Оценка качества моделей

4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F — критерий Фишера. Выберите лучшую модель

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции, называемый коэффициентом детерминации. Коэффициентом детерминации характеризует долю вариации результативного признака Y, учтенную в модели, и обусловленную влиянием фактора X.

4.1. Коэффициент детерминации определяется по формуле:

где — сумма квадратов отклонений, объясненная регрессией, и общая сумма квадратов отклонений соответственно.

Коэффициенты детерминации R-квадрат определены для каждой модели инструментом «Регрессия» пакета «Анализ данных» в Excel (таблица «Регрессионная статистика»):

Модель (1): 0,0001

Модель (2): 0,564

Модель (3): 0,764

Таким образом, вариация цены квартиры Y на 76,4% объясняется по уравнению (3) изменением жилой площади квартиры Х4; на 56,4% по уравнению (2) изменением общей площади квартиры Х2; на 0,01% по уравнению (1) вариацией города области Х1, т. е. наиболее адекватной моделью уравнения регрессии является зависимость цены квартиры от жилой площади квартиры Y = f (Х4).

4.2. Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели, содержащиеся в столбце «Остатки» таблицы «Вывод остатка». Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле

с помощью функции ABS в Excel.

Выполнение расчетов для модели (1):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

100,5 333 333

-62,53 333 333

164,5 614 035

42

62,2

100,5 333 333

-38,33 333 333

61,62 915 327

43

125

101,8 136 364

23,18 636 364

18,54 909 091

44

61,1

100,5 333 333

-39,43 333 333

64,53 900 709

45

67

101,8 136 364

-34,81 363 636

51,96 065 129

46

93

101,8 136 364

-8,813 636 364

9,477 028 348

47

118

100,5 333 333

17,46 666 667

14,80 225 989

48

132

101,8 136 364

30,18 636 364

22,8 684 573

49

92,5

101,8 136 364

-9,313 636 364

10,6 879 607

50

105

100,5 333 333

4,466 666 667

4,253 968 254

51

42

100,5 333 333

-58,53 333 333

139,3 650 794

52

125

100,5 333 333

24,46 666 667

19,57 333 333

53

170

101,8 136 364

68,18 636 364

40,10 962 567

54

38

101,8 136 364

-63,81 363 636

167,930 622

55

130,5

101,8 136 364

28,68 636 364

21,98 188 784

56

85

101,8 136 364

-16,81 363 636

19,78 074 866

57

98

101,8 136 364

-3,813 636 364

3,891 465 677

58

128

101,8 136 364

26,18 636 364

20,45 809 659

59

85

101,8 136 364

-16,81 363 636

19,78 074 866

60

160

100,5 333 333

59,46 666 667

37,16 666 667

61

60

101,8 136 364

-41,81 363 636

69,68 939 394

62

41

100,5 333 333

-59,53 333 333

145,203 252

63

90

100,5 333 333

-10,53 333 333

11,7 037 037

64

83

101,8 136 364

-18,81 363 636

22,66 703 176

65

45

101,8 136 364

-56,81 363 636

126,2 525 253

66

39

101,8 136 364

-62,81 363 636

161,606 061

67

86,9

101,8 136 364

-14,91 363 636

17,16 183 701

68

40

101,8 136 364

-61,81 363 636

154,5 340 909

69

80

101,8 136 364

-21,81 363 636

27,26 704 545

70

227

101,8 136 364

125,1 863 636

55,14 817 781

71

235

101,8 136 364

133,1 863 636

56,67 504 836

72

40

100,5 333 333

-60,53 333 333

151,3 333 333

73

67

100,5 333 333

-33,53 333 333

50,4 975 124

74

123

100,5 333 333

22,46 666 667

18,26 558 266

75

100

101,8 136 364

-1,813 636 364

1,813 636 364

76

105

100,5 333 333

4,466 666 667

4,253 968 254

77

70,3

100,5 333 333

-30,23 333 333

43,616 406

78

82

100,5 333 333

-18,53 333 333

22,60 162 602

79

280

100,5 333 333

179,4 666 667

64,952 381

80

200

100,5 333 333

99,46 666 667

49,73 333 333

Среднее

101,2375

101,2375

54,1 315 859

По столбцу относительных погрешностей найдем среднее значение

(с помощью функции СРЗНАЧ Excel).

Выполнение расчетов для модели (2):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

43,57 706 835

-5,577 068 345

14,67 649 565

42

62,2

79,61 483 813

-17,41 483 813

27,99 813 204

43

125

115,6 526 079

9,347 392 086

7,477 913 669

44

61,1

79,61 483 813

-18,51 483 813

30,3 025 174

45

67

43,57 706 835

23,42 293 165

34,95 959 948

46

93

79,61 483 813

13,38 516 187

14,39 264 717

47

118

115,6 526 079

2,347 392 086

1,989 315 327

48

132

115,6 526 079

16,34 739 209

12,38 438 794

49

92,5

115,6 526 079

-23,15 260 791

25,2 984 639

50

105

151,6 903 777

-46,6 903 777

44,46 702 638

51

42

43,57 706 835

-1,577 068 345

3,754 924 632

52

125

115,6 526 079

9,347 392 086

7,477 913 669

53

170

151,6 903 777

18,3 096 223

10,77 036 606

54

38

43,57 706 835

-5,577 068 345

14,67 649 565

55

130,5

151,6 903 777

-21,1 903 777

16,23 783 732

56

85

79,61 483 813

5,385 161 871

6,335 484 554

57

98

151,6 903 777

-53,6 903 777

54,78 609 969

58

128

151,6 903 777

-23,6 903 777

18,50 810 758

59

85

115,6 526 079

-30,65 260 791

36,6 189 166

60

160

115,6 526 079

44,34 739 209

27,71 712 005

61

60

43,57 706 835

16,42 293 165

27,37 155 276

62

41

43,57 706 835

-2,577 068 345

6,28 553 255

63

90

151,6 903 777

-61,6 903 777

68,54 486 411

64

83

151,6 903 777

-68,6 903 777

82,7 594 912

65

45

43,57 706 835

1,422 931 655

3,162 070 344

66

39

43,57 706 835

-4,577 068 345

11,73 607 268

67

86,9

115,6 526 079

-28,75 260 791

33,8 700 565

68

40

43,57 706 835

-3,577 068 345

8,942 670 863

69

80

79,61 483 813

0,385 161 871

0,481 452 338

70

227

151,6 903 777

75,3 096 223

33,17 604 507

71

235

151,6 903 777

83,3 096 223

35,45 090 311

72

40

43,57 706 835

-3,577 068 345

8,942 670 863

73

67

43,57 706 835

23,42 293 165

34,95 959 948

74

123

151,6 903 777

-28,6 903 777

23,32 551 032

75

100

115,6 526 079

-15,65 260 791

15,65 260 791

76

105

115,6 526 079

-10,65 260 791

10,14 534 087

77

70,3

79,61 483 813

-9,314 838 129

13,25 012 536

78

82

115,6 526 079

-33,65 260 791

41,3 976 575

79

280

151,6 903 777

128,3 096 223

45,82 486 511

80

200

151,6 903 777

48,3 096 223

24,15 481 115

Среднее

101,2375

101,2375

23,457 427

По столбцу относительных погрешностей найдем среднее значение

(с помощью функции СРЗНАЧ Excel).

Выполнение расчетов для модели (3):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

44,17 866 562

-6,178 665 622

16,25 964 637

42

62,2

86,27 023 362

-24,7 023 362

38,69 812 478

43

125

98,65 010 656

26,34 989 344

21,7 991 476

44

61,1

83,29 906 411

-22,19 906 411

36,33 234 715

45

67

43,43 587 325

23,56 412 675

35,17 033 844

46

93

65,71 964 454

27,28 035 546

29,33 371 555

47

118

143,2 176 491

-25,21 764 914

21,3 708 891

48

132

106,780 303

25,92 196 968

19,63 785 582

49

92,5

135,7 897 254

-43,28 972 537

46,79 970 311

50

105

113,5 059 541

-8,505 954 083

8,10 090 865

51

42

41,70 269 103

0,297 308 966

0,70 787 849

52

125

106,780 303

18,92 196 968

15,13 757 574

53

170

135,7 897 254

34,21 027 463

20,12 369 096

54

38

36,75 074 186

1,249 258 142

3,287 521 425

55

130,5

160,5 494 713

-30,4 947 125

23,2 641 475

56

85

81,31 828 444

3,68 171 556

4,33 143 007

57

98

103,6 020 557

-5,602 055 731

5,716 383 399

58

128

143,7 128 441

-15,71 284 406

12,27 565 942

59

85

120,9 338 778

-35,93 387 785

42,27 515 041

60

160

101,1 260 811

58,87 391 886

36,79 619 929

61

60

46,65 464 021

13,34 535 979

22,24 226 632

62

41

31,79 879 268

9,201 207 317

22,44 196 907

63

90

113,5 059 541

-23,50 595 408

26,11 772 676

64

83

119,6 958 906

-36,69 589 055

44,21 191 633

65

45

43,93 106 816

1,68 931 837

2,375 404 081

66

39

41,70 269 103

-2,702 691 034

6,929 977 011

67

86,9

142,4 748 568

-55,57 485 676

63,9 526 545

68

40

51,60 658 939

-11,60 658 939

29,1 647 346

69

80

96,17 413 197

-16,17 413 197

20,21 766 496

70

227

222,448 836

4,55 116 405

2,4 918 084

71

235

219,9 728 614

15,2 713 864

6,39 452 708

72

40

34,27 476 727

5,725 232 729

14,31 308 182

73

67

42,94 067 833

24,5 932 167

35,90 943 533

74

123

133,3 137 508

-10,31 375 079

8,385 163 241

75

100

88,7 462 082

11,2 537 918

11,2 537 918

76

105

115,9 819 287

-10,98 192 867

10,45 897 969

77

70,3

83,29 906 411

-12,99 906 411

18,49 084 511

78

82

115,9 819 287

-33,98 192 867

41,44 137 643

79

280

207,5 929 884

72,40 701 158

25,85 964 699

80

200

145,6 936 237

54,30 637 627

27,15 318 814

Среднее

101,2375

101,2375

21,89 080 885

По столбцу относительных погрешностей найдем среднее значение

,

это свидетельствует о том, что качество модели не удовлетворительное. Ближе всех к 7% значение.

Ни одну из моделей по данному критерию оценки считать приемлемой нельзя. Лучшей моделью является зависимость цены квартиры от жилой площади квартиры Y = f (Х4).

4.3. Проверим значимость полученных уравнений с помощью F — критерия Фишера.

,

k — количество факторов, включенных в модель.

F — статистики определены инструментом «Регрессия» пакета «Анализ данных» в Excel (таблицы «Дисперсионный анализ»):

F1 = 0,48 179

F2 = 49,17 440 478

F3 = 122,9 467 831

С помощью функции РАСПОБР Excel или по таблице найдем значение Fкр=4. 098 для уровня значимости б=5%, и чисел степеней свободы k1=1, k2=38.

F2> Fкр, F3> Fкр следовательно, уравнения модели (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модели (2) и (3) факторными переменными Х2 и Х4.

F1< Fкр, следовательно уравнение модели (1) не является значимым и использование этой модели нецелесообразно.

На основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади:.

Задача 1.5 Прогнозирование среднего значения

5. Для выбранной модели осуществите прогнозирование среднего значения показателя Y при уровне значимости б=0. 1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представьте графически: фактические и модельные значения Y, точки прогноза прогнозирования.

Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4=91 найдем с помощью функции МАКС в Excel. Тогда прогнозное значение Х4*=72.8. Рассчитаем по уравнению модели (1): прогнозное значение Y:

Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72.8 кв. м, то ожидаемая цена квартиры будет составлять около 177,3878 тыс. долл.

Зададим доверительную вероятность p=1-б=1−0. 1=0.9 и построим доверительный прогнозный интервал для среднего значения Y.

Предварительно подготовим:

· стандартная ошибка (таблица «Регрессионная статистика» итогов применения инструмента «Регрессия» пакета «Анализ данных»);

· по столбцу данных Х4 найдем среднее значение (функция СРЗНАЧ) и определим

· (функция КВАДРОТКЛ);

· tб — коэффициент Стьюдента для уровня значимости б=10% и числа степеней свободы k=38. tб=1. 686 (функция СТЬЮДРАСПОБР).

Тогда, предельная ошибка прогноза:

Следовательно, доверительный интервал имеет вид:

,

Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 127. 8758 тыс. долл. до 226. 8998 тыс. долл.

Выполненный прогноз стоимости квартиры оказался надежным (p=1-б=1−0. 1=0. 9), но не точным, так как диапазон верхней и нижней границ доверительного интервала отличаются в 1,77 раза:

DY = 226. 8998 / 127. 8758 = 1. 77.

Для построения графика используем «Мастер диаграмм» — покажем фактические исходные данные (поле корреляции). Затем с помощью опции «Добавить линию тренда», построим линию модели и покажем на графике результаты прогнозирования.

Задача 1.6 Пошаговая множественная регрессия

6. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счет значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.

Методом включения построим двухфакторные модели, сохраняя в них наиболее информативный фактор — жилую площадь квартиры (Х4).

В качестве «входного интервала Х» укажем значения факторов Х4 и Х1, с помощью инструмента «Регрессия» получим:

Регрессионная статистика

Множественный R

0,875 979 141

R-квадрат

0,767 339 455

Нормированный R-квадрат

0,754 763 209

Стандартная ошибка

28,37 139 894

Наблюдения

40

Таким образом, модель (4) зависимости цены квартиры Y от жилой площади квартиры Х4 и города области Х1 построена, ее уравнение имеет вид:

Используем в качестве «входного интервала Х» значения факторов Х4 и Х2, с помощью «Регрессии» найдем:

Регрессионная статистика

Множественный R

0,874 162 592

R-квадрат

0,764 160 238

Нормированный R-квадрат

0,751 412 142

Стандартная ошибка

28,56 458 338

Наблюдения

40

Таким образом, модель (5) зависимости цены квартиры Y от жилой площади квартиры Х4 и от числа комнат в квартире Х2 построена, ее уравнение имеет вид:

Построим множественную модель регрессии, учитывая все факторы (Х4, Х1, и Х2):

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,876 217 908

R-квадрат

0,767 757 822

Нормированный R-квадрат

0,748 404 307

Стандартная ошибка

28,73 687 504

Наблюдения

40

Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2 построена, ее уравнение имеет вид:

Выберем лучшую из построенных моделей.

Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов инструмента «Регрессия». Чем больше величина нормированного коэффициента детерминации, тем лучше модель.

,

где — коэффициент детерминации, n — число наблюдений, k — число независимых переменных.

Модель (4): 0,767 339 455

Модель (5): 0,764 160 237

Модель (6): 0,767 757 821

Таким образом, лучшей является модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2:

Коэффициент регрессии в1=6. 859, следовательно, при изменении города области (Х1), при одном и том же числе комнат в квартире (Х2) и одной и той же жилой площади, цена квартиры (Y) увеличится в среднем на 6,859 тыс. долл.

Коэффициент регрессии в2=-1. 985, следовательно, при изменении числа комнат в квартире (Х2) при одной и той же жилой площади (Х4) и одном и том же городе области (Х1), цена квартиры (Y) уменьшится в среднем на 1. 985 тыс. долл.

Коэффициент регрессии в3=2. 591, следовательно, при увеличении жилой площади квартиры на 1 кв. м. (Х4) при одном и том же городе области (Х1) и одном и том же кол-ве комнат (Х2), цена квартиры (Y) увеличится в среднем на 2. 591 тыс. долл.

Свободный коэффициент не имеет экономического смысла, но говорит о том, что сначала меняется результат Y, а потом факторы X1, X2, X4.

Задача 1.7. Оценка качества многофакторной модели

7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, — и -коэффициентов.

Для оценки качества выбранной множественной модели (6), аналогично п. 1.4 данной задачи, используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F-критерий Фишера.

Коэффициент детерминации R-квадрат возьмем из итогов «Регрессии» (таблица «Регрессионная статистика» для модели (6)).

, следовательно, вариация (изменение) цены квартиры Y на 76,77% объясняется по данному уравнению вариацией города области Х1, числа комнат в квартире Х2 и жилой площади Х4.

Используем исходные данные Yi и найденные инструментом «Регрессия» остатки (таблица «Вывод остатка» для модели (6)). Рассчитаем относительные погрешности и найдем среднее значение.

Вывод остатка

Наблюдение

Предсказанное Y

Остатки

Отн. погрешность

1

45,95 089 273

-7,95 089 273

20,92 340 192

2

86,10 296 493

-23,90 296 493

38,42 920 407

3

94,84 442 678

30,15 557 322

24,12 445 858

4

84,17 648 426

-23,7 648 426

37,76 838 667

5

40,2 537 216

26,7 462 784

39,91 981 851

6

68,70 572 376

24,29 427 624

26,12 287 768

7

143,7 464 899

-25,7 464 899

21,81 905 923

8

106,907 598

25,90 924 022

19,62 821 228

9

135,357 993

-42,85 799 303

46,33 296 544

10

114,4 792 566

-9,47 925 665

9,27 863 476

11

41,48 765 602

0,512 343 975

1,219 866 607

12

103,2 329 236

21,76 707 636

17,41 366 109

13

130,3 567 798

39,64 322 022

23,3 195 413

14

35,41 901 876

2,580 981 242

6,7 920 559

15

155,4 129 693

-24,91 296 925

19,903 979

16

84,32 108 188

0,678 918 123

0,798 727 204

17

98,552 279

-0,55 227 902

0,56 355 002

18

144,2 104 618

-16,21 046 182

12,66 442 329

19

122,8 677 535

-37,86 775 351

44,55 029 825

20

100,221 225

59,97 787 748

37,48 617 343

21

53,27 196 558

6,728 034 423

11,21 339 071

22

35,6 605 378

5,933 946 225

14,47 303 957

23

114,4 792 566

-24,47 925 665

27,19 917 406

24

113,1 343 153

-30,13 431 529

36,30 640 396

25

40,43 190 991

4,568 090 093

10,15 131 132

26

39,34 427 892

-0,344 278 918

0,882 766 457

27

144,4 794 501

-57,57 945 009

66,25 943 623

28

56,4 827 667

-16,4 827 667

41,20 691 675

29

95,38 240 332

-15,38 240 332

19,22 800 415

30

228,6 988 826

-1,698 882 564

0,748 406 416

31

222,8 067 278

12,19 327 221

5,188 626 473

32

38,81 483 144

1,185 168 555

2,962 921 389

33

48,36 325 811

18,63 674 189

27,81 603 267

34

126,6 080 021

-3,608 002 113

2,933 335 051

35

84,85 052 935

15,14 947 065

15,14 947 065

36

116,7 991 162

-11,79 911 625

11,23 725 357

37

84,17 648 426

-13,87 648 426

19,73 895 342

38

113,9 412 801

-31,94 128 011

38,95 278 062

39

215,494 184

64,50 581 599

23,3 779 142

40

141,7 795 953

58,22 040 472

29,11 020 236

Среднее

101,2375

22,51 770 962

По столбцу относительных погрешностей найдем среднее значение =22. 51% (с помощью функции СРЗНАЧ).

Сравнение показывает, что 22. 51%>7%. Следовательно, точность модели неудовлетворительная.

С помощью F — критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов применения инструмента «Регрессия» (таблица «дисперсионный анализ» для модели (6)) F=39,6702.

С помощью функции FРАСПОБР найдем значение Fкр=3. 252 для уровня значимости б = 5%, и чисел степеней свободы k1 = 2, k2 = 37.

F> Fкр, следовательно, уравнение модели (6) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (6) факторными переменными Х1, Х2. и Х4.

Дополнительно с помощью t-критерия Стьюдента проверим значимость отдельных коэффициентов модели.

t-статистики для коэффициентов уравнения регрессии приведены в итогах инструмента «Регрессия». Получены следующие значения для выбранной модели (6)

Критическое значение tкр найдено для уровня значимости б=5% и числа степеней свободы k=40−2-1=37. tкр=2. 026 (функция СТЬЮДРАСПОБР).

Для свободного коэффициента б=-5. 643 определена статистика, < tкр, следовательно, свободный коэффициент не является значимым, его можно исключить из модели.

Для коэффициента регрессии в1=6. 859 определена статистика, < tкр, следовательно, коэффициент регрессии в1 не является значимым, его и фактор города области можно удалить из модели.

Для коэффициента регрессии в2=-1,985 определена статистика, < tкр, следовательно, коэффициент регрессии в2 не является значимым, его и фактор числа комнат в квартире можно исключить из модели.

Для коэффициента регрессии в4=2. 591 определена статистика, > tкр, следовательно, коэффициент регрессии в4 является значимым, его и фактор жилой площади квартиры можно сохранить в модели.

Выводы о значимости коэффициентов модели сделаны на уровне значимости б=5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент б можно считать значимым на уровне 0. 64 = 64%; коэффициент регрессии в1 — на уровне 0,46 = 46%; коэффициент регрессии в2 — на уровне 0,8 = 80%; а коэффициент регрессии в4 — на уровне 2,27E-06= 2,2 669 179 095 1854E-06 = 0,2%.

При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (6) используем нормированные коэффициенты детерминации.

Модель

Нормированный R-квадрат

(3)

0,757 683 880 132 941

(6)

0,748 404 306 989 435

Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 и фактора «число комнат в квартире» Х2 качество модели ухудшилось, что говорит в пользу удаления факторов Х1 и Х2 из модели.

Проведем дальнейшие расчеты.

Средние коэффициенты эластичности в случае линейной модели определяются формулами

.

С помощью функции СРЗНАЧ найдем:

=0. 45, =2. 6, =42. 05, =101. 24.

Тогда

,

,

Следовательно, увеличение жилой площади Х4 при том же кол-ве комнат и городе области на 1% приводит к увеличению цены квартиры в среднем на 1,076%.

При изменении города области (Х1) и неизменной жилой площади и числе комнат в квартире цена квартиры увеличится в среднем на 0,03%.

При изменении числа комнат в квартире (Х2) и неизменной жилой площади и городе области цена уменьшается в среднем на 0,05%.

Бета-коэффициенты определяются по формулам:

,

где среднее квадратическое отклонение j — го фактора —.

,

С помощью функции СТАНДОТКЛОН найдем SX1= 0,504, SX2= 1,194, SX4=20. 223; SY= 57,291.

Тогда

;

;

Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0. 06 своего стандартного отклонения SY, при увеличении только фактора Х2 на одно его стандартное отклонение — уменьшается на 0,041 SY, при увеличении только фактора Х4 на одно его стандартное отклонение — увеличивается на 0,914 SY

Дельта-коэффициенты определяются формулами

.

Найдем коэффициенты парной корреляции с использованием инструмента «Корреляция» пакета «Анализ данных» в Excel.

Y

X1

X2

X4

Y

1

X1

-0,1 126

1

X2

0,751 061

-0,0341

1

X4

0,874 012

-0,0798

0,868 524

1

Коэффициент детерминации был определен ранее и равен 0. 7677.

Вычислим дельта-коэффициенты:

;

Поскольку Д1<0 и Д2< 0, то факторные переменные Х1 и Х2 выбрана неудачно, и их нужно удалить из модели. Значит, по уравнению полученной линейной трехфакторной модели изменение результирующего фактора Y (цены квартиры) на 104% объясняется воздействием фактора Х4 (жилой площадью квартиры), на 4% воздействием фактора Х2 (число комнат), на 0,0859% воздействием фактора Х1 (город области).

Задача 2.1. Проверка наличия аномальных наблюдений

1. Проверить наличие аномальных наблюдений.

Используем метод Ирвина, основанный на определении лt-статистик по формуле:

лt=,

где

,

.

Найдем Sy=7. 293 (функция СТАНДОТКЛОН) и рассчитаем лt-статистики.

Результат расчетов приведем в таблице:

t

yt

|yt-yt-1|

t

1

43

-

-

2

47

4

0,548

3

50

3

0,411

4

48

2

0,274

5

54

6

0,823

6

57

3

0,411

7

61

4

0,548

8

59

2

0,274

9

65

6

0,823

При n=9 и уровне значимости б=5% можно использовать лкр=1.5.

Все лt-статистики меньше лкр, т. е. аномальных наблюдений нет. Этот вывод подтверждает графическое представление временного ряда.

Исходный ряд будем использовать для выполнения следующих пунктов задачи.

Задача 2.2. Построение линейной модели

2. Построить линейную модель, параметры которой оценить МНК (- расчетные смоделированные значения временного ряда).

С помощью инструмента «Регрессия» найдем:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,970 013 862

R-квадрат

0,940 926 893

Нормированный R-квадрат

0,932 487 878

Стандартная ошибка

1,895 064 601

Наблюдения

9

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

400,4 166 667

400,4 166 667

111,4 972 376

1,4929E-05

Остаток

7

25,13 888 889

3,591 269 841

Итого

8

425,5 555 556

Таким образом, модель построена, ее уравнение имеет вид:

Коэффициент регрессии показывает, что с каждой неделей спрос на кредитные ресурсы финансовой компании (Y) увеличивается в среднем на 2. 583 млн руб.

2.2. Рассчитаем коэффициенты линейной модели с помощью МНК.

Найдем параметры a1 и a0 уравнения модели, используя МНК.

Для этого решим систему уравнений следующего вида:

Промежуточные расчеты представлены в таблице

Номер наблюдения

1

2

3

4

5

6

7

8

9

?

ti

1

2

3

4

5

6

7

8

9

45

yi

43

47

50

48

54

57

61

59

65

484

ti2

1

4

9

16

25

36

49

64

81

285

tiyi

43

94

150

192

270

342

427

472

585

2575

На основе промежуточных данных таблицы решим систему уравнений:

,

откуда a0=40,861, a1=2,583, тогда уравнение линейной модели примет вид:

Построим графическое представление линейной модели, добавив к исходным данным линию тренда

Задача 2.3. Оценка адекватности модели

3. Оценить адекватность построенной модели, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S — критерия взять табулированные границы 2.7 — 3. 7).

Проверка перечисленных свойств состоит в исследовании Ряда остатков et, который содержится в таблице «Вывод остатка» итогов применения инструмента «Регрессия».

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное y (t)

Остатки

e (t) — e (t-1)

(e (t) — e (t-1))2

e (t)2

1

43,44 444 444

-0,444 444 444

-

-

0,1975

2

46,2 777 778

0,972 222 222

1,4167

2,0069

0,9452

3

48,61 111 111

1,388 888 889

0,4167

0,1736

1,9290

4

51,19 444 444

-3,194 444 444

-4,5833

21,0069

10,2045

5

53,77 777 778

0,222 222 222

3,4167

11,6736

0,0494

6

56,36 111 111

0,638 888 889

0,4167

0,1736

0,4082

7

58,94 444 444

2,55 555 556

1,4167

2,0069

4,2253

8

61,52 777 778

-2,527 777 778

-4,5833

21,0069

6,3897

9

64,11 111 111

0,888 888 889

3,4167

11,6736

0,7901

СУММА

0,0000

69,7222

25,1389

Для проверки свойства независимости остаточной компоненты используем критерий Дарбина-Уотсона. Согласно этому критерию вычислим по формуле статистику

.

Определим:

(функция СУММКВ);

=69. 72

(функция СУММКВРАЗН).

Таким образом,

=2. 773.

Поскольку > 2, то перейдем к = 4-= 4−2. 773=1. 227.

По таблице d-статистик Дарбина-Уотсона для числа n=9 и числа независимых переменных модели k=1 определим критические уровни: нижний d1=0. 82 и верхний d2=1. 32.

Т.к. (d2; 2), следовательно, свойство независимости остатков для построенной модели выполняется, по данному критерию модель адекватна.

· Для проверки свойства случайности остаточной компоненты используем критерий поворотных точек (пиков) (поворотные точки — значение, которое одновременно больше (меньше) соседних с ним элементов), основой которого является определение количества поворотных точек для ряда остатков. С помощью «Мастера диаграмм» построим график остатков et., добавим к нему дополнительные данные и выделим поворотные точки.

·

Поворотные точки — третья, четвертая, седьмая, восьмая. Их количество p=4. По формуле

pкр=

при n=9 вычислим критическое значение pкр==2.

Сравним значения p и pкр: p=4> pкр=2, следовательно, свойство случайности для ряда остатков выполняется. Модель по этому критерию адекватна.

· Для проверки соответствия ряда остатков нормальному закону распределения используем R/S критерий.

В соответствии с этим критерием вычислим по формуле статистику

R/S=

Подготовим для вычислений:

emax=2. 056 — максимальный уровень ряда остатков (функция МАКС);

emin=-3. 194 — минимальный уровень ряда остатков (функция МИН);

S (e)=2. 952

среднеквадратическое отклонение ряда остатков.

Получим:

R/S = = 2. 778

По таблице критических границ отношения R/S определим критический интервал. При n=9 можно использовать (2,67; 3,69). Сопоставим фактическую величину R/S с критическим интервалом: 2. 778(2. 67;3. 69), значит, для построенной модели свойство нормального распределения остаточной компоненты выполняется.

Проведенная проверка показывает, что для построенной модели выполняются все свойства. Таким образом, данная модель является адекватной, и ее можно использовать для построения прогнозных оценок.

Задача 2.4. Оценка точности модели

4. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.

Используем исходные данные Yt и найденные инструментом «Регрессия» остатки et (таблица «Вывод остатков»). По формуле

Рассчитаем столбец относительных погрешностей и найдем среднее значение =2. 57%.

Вывод остатка

Наблюдение

Предсказанное y (t)

Остатки

Отн. погрешность

1

43,44 444 444

-0,444 444 444

1,03%

2

46,2 777 778

0,972 222 222

2,07%

3

48,61 111 111

1,388 888 889

2,78%

4

51,19 444 444

-3,194 444 444

6,66%

5

53,77 777 778

0,222 222 222

0,41%

6

56,36 111 111

0,638 888 889

1,12%

7

58,94 444 444

2,55 555 556

3,37%

8

61,52 777 778

-2,527 777 778

4,28%

9

64,11 111 111

0,888 888 889

1,37%

Среднее

53,778

2,57%

Сравнение показывает, что 2. 57%<7%, следовательно модель имеет высокую точность.

Задача 2.5. Осуществление прогноза

5. Осуществить прогноз спроса на следующие 2 недели (доверительный интервал прогноза рассчитать при доверительной вероятности p=70%).

«Следующие 2 недели» соответствуют периодам k1=1 и k2=2, при этом =n+k1=10 и =n+k2=11.

Согласно уравнению модели получим точечные прогнозные оценки:

.

Таким образом, ожидаемый спрос на кредитные ресурсы финансовой компании в следующие 2 недели будут составлять около 66. 691 млн руб. и 69. 274 млн руб. соответственно.

Для оценки точности прогнозирования рассчитаем границы прогнозного интервала для индивидуальных значений результирующего признака (доверительная вероятность p=70%).

Ширина доверительного интервала определяется по формуле:

,

где n — количество наблюдений, Se — величина стандартной ошибки,

=1. 895

(можно взять из протокола регрессионного анализа), среднее значения параметров t равно:

===5

Рассчитаем:

tб=1. 119 (функция СТЬЮДРАСПОБР при б=100%-70%=30%, k=9−2=7);

5 (функция СРЗНАЧ);

(функция КВАДРОТКЛ).

Вычислим размах прогнозного интервала для индивидуальных значений:

При =10 получим

U (1)==2,621

и определим границы доверительного интервала:

;

При =11 получим

U (2)==2,774

и определим границы доверительного интервала:

;

Таким образом, с надежностью 70% можно утверждать, что спрос на кредитные ресурсы финансовой компании на следующую (10-ю) неделю будет составлять от 64. 07 до 69. 312 млн руб., а через неделю (11-ю) — от 66.5 до 72. 048 млн руб.

6. Задача 2.6. Графическое представление результатов моделирования и прогнозирования Фактические значения показателя, результаты моделирования и прогнозирования представить графически.

Для построения графика используем «Мастер диаграмм» (точечная) — покажем исходные данные. С помощью опции «Добавить линию тренда» построим линию модели и покажем на графике результаты прогнозирования с помощью опции «Добавить данные».

Список литературы

1. Орлова И. В. Экономико-математические методы и модели. Выполнение расчетов в среде Excel: Практикум. — М.: Финстатинформ, 2000.

2. Орлова И. В., Половников В. А. Экономико-математические методы и модели: Компьютерное моделирование. Учебное пособие — М.: ВЗФЭИ: Вузовский учебник, 2007. Практикум по эконометрике: Учеб. пособие / Под ред. И. И. Елисеевой и др. — М.: Финансы и статистика, 2001. — 192с.

3. Эконометрика. Методические указания по выполнению контрольной работы. — М.: ИНФРА-М; Вузовский учебник, 2007. — 72с.

4. Эконометрика. Методические указания по изучению дисциплины и выполнению контрольной и аудиторной работы на ПЭВМ. — М.: Вузовский учебник, 2005. — 122с.

5. Эконометрика: Учебник / Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2002. — 344с.

ПоказатьСвернуть
Заполнить форму текущей работой