Прогноз среднего значения цены

Тип работы:
Контрольная
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Задача 1

В базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля Y от его возраста X1 и мощности двигателя X2 из базы данных выбраны сведения о 16 автомобилях.

Номер автомобиля

Цена (тыс.у .е.)

Возраст (лет)

Мощность двигателя (л.с.)

1

14,4

4,0

154

2

16,9

2,0

155

3

13,0

5,0

149

4

9,6

7,0

128

5

9,8

7,0

134

6

9,6

7,0

127

7

16,8

2,0

157

8

14,8

4,0

160

9

9,8

7,0

134

10

16,9

2,0

154

11

16,0

3,0

161

12

17,4

2,0

167

13

17,2

2,0

163

14

17,4

2,0

163

15

15,7

3,0

155

16

17,1

2,0

162

1. Парные зависимости

1.1 Построить поля рассеяний для цены Y и возраста автомобиля X1, а также для цены Y и мощности двигателя X2. На основе их визуального анализа выдвинуть гипотезы о виде статистической зависимости Y от X1 и Y от X2 и записать их математически

1.2 Методом наименьших квадратов найти оценки линейных уравнений регрессии

,.

1.3 С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9

1.4 Проверить статистическую значимость параметров и уравнений регрессии с надежностью 0,9

1.5 Построить доверительные полосы надежности 0,95 для среднего значения цены автомобиля в зависимости от его возраста, а также от мощности двигателя. Изобразить графически линии регрессии и доверительные полосы вместе с полями рассеяний

1.6 На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95

Решение

1.1. По исходным данным построим поля рассеяния переменной у в зависимости от и.

Рис. 1.1. Поле рассеяния «возраст-цена автомобиля»

На основе анализа поля рассеяния (рис. 1. 1), можно выдвинуть гипотезу о наличии обратной линейной связи между ценой автомобиля () и его возраста (), т. е. с увеличением возраста автомобиля цена на него уменьшается. Зависимость описывается линейной моделью вида:

где и — неизвестные постоянные коэффициенты, а — случайное отклонение, вызванное влиянием неучтённых факторов и погрешностями измерений.

Аналогично, на основе анализа поля рассеяния (рис. 1. 2) можно выдвинуть гипотезу между ценой автомобиля y и мощностью двигателя зависимость прямая, т. е. с увеличением мощности двигателя цена автомобиль возрастает. И зависимость описывается моделью:

Рис. 1.2 Поле рассеяния «мощность двигателя-цена автомобиля»

Найдем уравнения линейной регрессии

и

неизвестные коэффициенты находятся по формулам (используя метод наименьших квадратов (МНК)):

, ,

Для вычисления оценок параметров моделей составляем вспомогательную таблицу 1.1.

Таблица 1.1. Промежуточные расчеты для оценок параметров

1

4

154

14,4

16

23 716

57,6

2217,6

616

207,36

2

2

155

16,9

4

24 025

33,8

2619,5

310

285,61

3

5

149

13

25

22 201

65

1937

745

169

4

7

128

9,6

49

16 384

67,2

1228,8

896

92,16

5

7

134

9,8

49

17 956

68,6

1313,2

938

96,04

6

7

127

9,6

49

16 129

67,2

1219,2

889

92,16

7

2

157

16,8

4

24 649

33,6

2637,6

314

282,24

8

4

160

14,8

16

25 600

59,2

2368

640

219,04

9

7

134

9,8

49

17 956

68,6

1313,2

938

96,04

10

2

154

16,9

4

23 716

33,8

2602,6

308

285,61

11

3

161

16

9

25 921

48

2576

483

256

12

2

167

17,4

4

27 889

34,8

2905,8

334

302,76

13

2

163

17,2

4

26 569

34,4

2803,6

326

295,84

14

2

163

17,4

4

26 569

34,8

2836,2

326

302,76

15

3

155

15,7

9

24 025

47,1

2433,5

465

246,49

16

2

162

17,1

4

26 244

34,2

2770,2

324

292,41

Сумма

61

2423

232,4

299

369 549

787,9

35 782

8852

3521,52

Среднее

3,81

151,44

14,53

18,69

23 096,81

Подставляя полученные значения найдем оценки параметров:

,

Таким образом,

Аналогично находятся оценки коэффициентов модели

Тогда ,

Таким образом,.

1.3 Коэффициент парной корреляции находится по формуле:

Подставляя соответствующие значения, получим

Так как-0,997< 0, то связь между признаками обратная, т. е. с ростом уменьшается y. Используя таблицу Чедока при определяем, что связь между признаками сильная.

Проверим значимость коэффициента корреляции с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение =1,76. Тогда

то существенно отличается от 0 и существует сильная линейная отрицательная связь между y и.

Аналогично проверим неравенство для:

Так как> 0, то связь между признаками прямая, т. е. с ростом возрастает y. Используя таблицу Чедока при 0,952 определяем, что связь между признаками сильная.

Проверим значимость коэффициента корреляции с помощью критерия Стьюдента. При уровне значимости 0,9 табличное значение =1,76. Тогда

,

значит, существенно отличается от 0 и существует сильная линейная положительная связь между y и.

1.4 Проверим статистическую значимость параметров и уравнений регрессии с надежностью 0,9 с помощью t — статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигаем гипотезу о статистически незначимом отличии показателей от нуля:

уравнения

Табличное значение для числа степеней свободы и составляет.

Определим случайные ошибки, ,.

, ,

Таблица 1.2 Расчетная таблица

0,152

0,023

0,188

0,035

-0,302

0,091

-1,813

3,285

0,229

0,052

1,188

1,410

-0,217

0,047

3,188

10,160

-0,017

0,000

3,188

10,160

-0,217

0,047

3,188

10,160

-0,402

0,162

-1,813

3,285

0,552

0,305

0,188

0,035

-0,017

0,000

3,188

10,160

-0,302

0,091

-1,813

3,285

0,275

0,076

-0,813

0,660

0,198

0,039

-1,813

3,285

-0,002

0,000

-1,813

3,285

0,198

0,039

-1,813

3,285

-0,025

0,001

-0,813

0,660

-0,102

0,010

-1,813

3,285

Сумма

0,984

66,438

Тогда

Так как < (1. 76<142,98), < (1,76< 44,85) и < (1. 76<45,32), то гипотеза отклоняется, т. е. не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительный интервал для. Для этого определим предельную ошибку для каждого показателя:

,

Доверительные интервалы:

для

для.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и, находясь в указанных границах, не принимают нулевых значений, т. е. являются статистически значимыми и существенно отличны от нуля. Следовательно, полученное уравнение линии регрессии статистически значимо в целом и его можно использовать для прогноза. Аналогично проведем оценку статистической значимости параметров, и уравнения регрессии

Определим случайные ошибки, ,.

Составим расчетную таблицу

-0,701

0,491

2,563

6,566

1,574

2,479

3,563

12,691

-0,977

0,955

-2,438

5,941

0,343

0,117

-23,438

549,316

-0,806

0,650

-17,438

304,066

0,567

0,322

-24,438

597,191

1,025

1,050

5,563

30,941

-1,649

2,721

8,563

73,316

-0,806

0,650

-17,438

304,066

1,799

3,237

2,563

6,566

-0,674

0,454

9,563

91,441

-0,623

0,388

15,563

242,191

0,076

0,006

11,563

133,691

0,276

0,076

11,563

133,691

0,374

0,140

3,563

12,691

0,201

0,040

10,563

111,566

Сумма

13,775

2615,938

Тогда

Так как < (1. 76<6,62), < (1. 76<12,11), и < (1. 76<11,61), то гипотеза отклоняется, т. е., и не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительные интервалы для и.

Доверительные интервалы:

.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и, находясь в указанных границах, не принимают нулевого значения, т. е. являются статистически значимыми и существенно отличны от нуля. Следовательно, полученное уравнение линии регрессии статистически значимо в целом и его можно использовать для прогноза.

1.5. Доверительные интервалы для среднего значения цены автомобиля в зависимости от его возраста для уравнения регрессии находятся по формуле

где соответственно верхняя и нижняя границы доверительного интервала; значение независимой переменной для которого определяется доверительный интервал, квантиль распределения Стьюдента, доверительная вероятность, (n-2) — число степеней свободы;

, ,

Сначала рассмотрим уравнение

.

По условию задачи число степеней свободы 14 тогда, по таблице распределения Стьюдента находим t0. 95 = 2,14.

потребительский парный корреляция статистика стьюдент

Получим

2

17,202

0,089

17,012

17,392

3,81

14,525

0,066

14,383

14,667

7

9,817

0,123

9,554

10,081

Рассмотрим уравнение

9,033

0,535

7,888

10,177

9,033

14,525

0,248

13,994

15,056

14,525

18,023

0,391

17,187

18,859

18,023

Построим доверительные полосы надежности для средней цены автомобиля в зависимости от его возраста, а также изобразим линию регрессии и поле рассеяний.

Построим доверительные полосы надежности для средней цены автомобиля в зависимости от его мощности двигателя, а также изобразим линию регрессии и поле рассеяний.

1.6 Аналогично, как в пункте 1.5. найдем доверительные интервалы для среднего значения цены автомобиля, если возраст автомобиля составляет 3

Заполним таблицу:

3

15,725

0,071

15,572

15,878

При возрасте автомобиля 3 года, средняя цена автомобиля будет находиться в интервале (15,572; 15,878) тыс.у.е.

Найдем доверительные интервалы для среднего значения цены автомобиля, если мощность двигателя составляет 165 л.с.

Заполним таблицу:

165

17,573

0,362

16,8

18,347

При мощности двигателя составляет 165 л.с., средняя цена автомобиля будет находиться в интервале (16,8; 18,347) тыс.у.е.

2. Множественная зависимость

2.1 По методу наименьших квадратов найти оценки коэффициентов множественной линейной регрессионной модели

2.2 Проверить статистическую значимость параметров и уравнения множественной регрессии с надежностью 0. 9

2.3 Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года и мощностью двигателя 165 л.с. с доверительной вероятностью 0. 95

Решение

2.1 Уравнение регрессии будем искать в виде:

Введем следующие обозначения

Тогда

Вектор находится по формуле

В нашем случае

16

61

2423

232,4

61

299

8852

787,9

2423

8852

369 549

35 782

Тогда

16

61

2423

-1

232,4

80,210

-2,731

-0,460

232,4

61

299

8852

787,9

=

-2,731

0,104

0,015

787,9

=

2423

8852

369 549

35 782

-0,460

0,015

0,003

35 782

11,74

=

-1,20

0,05

Таким образом, получили уравнение множественной регрессии

.

2.2 Вычислим коэффициент парной корреляции

Проверим статистическую значимость параметров и уравнения множественной регрессии с надежностью 0.9. Вычислим коэффициент множественной корреляции:

Составим расчетную таблицу

1

14,425

-0,025

0,63

-0,12 500

0,016

2

16,864

0,036

0,127

2,37 500

5,641

3

12,987

0,013

0,16

-1,52 500

2,326

4

9,578

0,022

0,49

-4,92 500

24,256

5

9,869

-0,069

0,476

-4,72 500

22,326

6

9,529

0,071

0,498

-4,92 500

24,256

7

16,961

-0,161

0,2 605

2,27 500

5,176

8

14,716

0,084

0,702

0,27 500

0,076

9

9,869

-0,069

0,476

-4,72 500

22,326

10

16,816

0,084

0,708

2,37 500

5,641

11

15,960

0,040

0,159

1,47 500

2,176

12

17,446

-0,046

0,216

2,87 500

8,266

13

17,252

-0,052

0,275

2,67 500

7,156

14

17,252

0,148

0,2 177

2,87 500

8,266

15

8,912

6,788

46,7 632

1,17 500

1,381

16

17,204

-0,104

0,1 080

2,57 500

6,631

сумма

46,17 259

145,910

Тогда

Коэффициент множественной детерминации равен:

Зависимость от и характеризуется как средняя, в которой 68,9% вариации средней цены автомобилей определяется вариацией учтенных в модели факторов: среднего возраста автомобиля и средней мощности двигателя. Прочие факторы, не включенные в модель, составляют 31,1% от общей вариации.

Проверим гипотезу о статистической значимости уравнения регрессии и показателя тесноты связи (), с помощью — критерия Фишера.

Найдем

Табличное значение при уровне значимости составляет

Сравнивая и, приходим к выводу к выводу о необходимости принять гипотезу, так как =2,76 < =14,4. С вероятностью 0.9 делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались не под случайным воздействием факторов и.

2.3 Рассчитаем точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года и мощностью двигателя 165 л.с. с доверительной вероятностью 0. 95

Для =3; = 165 получаем точечный прогноз:

Для нахождения интервального прогноза вычислим значения всех параметров, входящих в формулу:

где , — соответственно верхняя и нижняя границы доверительного интервала,

— вектор независимых переменных, для которого определяется интервал,

=2,16 — квантиль распределения Стьюдента,

— доверительная вероятность, n — количество наблюдений, (n-3) — число степеней свободы,

Получаем:

=0,28;; S =1,885;;

И тогда и.

Таким образом, получили, что средняя цена автомобиля возраста 3 года и мощностью 165 л.с. будет заключена в интервале (14,24; 18,54) тыс.у.е.

3. Экономическая интерпретация

На основе полученных в пунктах 1 и 2 статистических характеристик провести содержательный экономический анализ зависимости цены автомобиля от его возраста и мощности двигателя.

Решение

На основании проведённых расчётов и полученных статистических характеристик можно сделать определённые выводы относительно взаимосвязей между исследуемыми экономическими показателями.

Так как и проверка значимости показала его существенное отличие от 0, то есть основания утверждать, что между y и существует сильная отрицательная линейная зависимость, которая может быть отражена с помощью найденного уравнения регрессии. Коэффициент = ?1,48 характеризует размер уменьшения цены на автомобиль, обусловленного увеличением возраста автомобиля на единицу. т. е. при увеличении возраста автомобиля на 1 год, средняя цена на автомобиль уменьшается на 1,48 тыс. у.е.

Значение 0,952 свидетельствует о сильной линейной связи между y и:. Коэффициент b1 = 0,23 в уравнении показывает, что при увеличении мощности двигателя на 1 л.с. средняя цена автомобиля увеличивается на 0. 23 тыс. у.е.

Коэффициент =-1,2 в уравнении показывает, что при увеличении возраста автомобиля на 1 год и неизменной мощности двигателя следует ожидать уменьшение цены автомобиля на 1,2 тыс. у.е. Коэффициент = 0,05 показывает, что при увеличении мощности двигателя на 1 л.с. и при неизменном возрасте автомобиля, следует ожидать увеличение цены автомобиля на 0. 05 тыс. у.е.

Задача 2

В базе данных магазина также содержится информация об объеме ежемесячных продажах автомобилей за прошлый год, представленная в таблице

Месяц,

Объем продаж (тыс. у. е.),

1

229

2

207

3

217

4

257

5

272

6

298

7

313

8

324

9

286

10

314

11

344

12

318

1. Представить графически ежемесячные объемы продаж автомагазина. На основе визуального анализа построенного графика выдвинуть гипотезу о виде статистической зависимости объема продаж от времени и записать ее математически.

2. Методом наименьших квадратов найти оценку уравнения линейного тренда

3. Для линии тренда построить доверительную полосу надежности 0. 975. Нарисовать ее на графике вместе с линией тренда и исходным временным рядом.

4. С помощью уравнения тренда найти точечный и интервальный прогноз (надежности 0. 975) для среднего объема продаж t=15.

Решение:

1. Представим графически ежемесячные объемы продаж автомагазина

На основании визуального наблюдения ломанной кривой, отражающей характер изменения по месяцам объема продаж автомобилей, выдвигаем гипотезу о линейном тренде. Следовательно, трендовая модель, отражающая изменение объема продаж автомобилей, запишется в виде:

где — неизвестные параметры, -случайное отклонение.

2. Коэффициенты регрессионного уравнения тренда находятся по методу наименьших квадратов и равны:

Воспользуемся вспомогательной таблицей:

1

1

1

229

229

2

2

4

207

414

3

3

9

217

651

4

4

16

257

1028

5

5

25

272

1360

6

6

36

298

1788

7

7

49

313

2191

8

8

64

324

2592

9

9

81

286

2574

10

10

100

314

3140

11

11

121

344

3784

12

12

144

318

3816

сумма

78

650

3379

23 567

И получим

Следовательно, уравнение линейного тренда будет иметь вид:

3. Доверительный интервал для линейного тренда находится по формуле

где

При уровне значимости 0,975 табличное значение =2,206.

Заполним вспомогательную таблицу:

1

229

219,91

9,8 974

82,6 234 385

-5,5

30,25

2

207

231,124

-24,124

581,945 333

-4,5

20,25

3

217

242,337

-25,337

641,954 946

-3,5

12,25

4

257

253,55

3,44 988

11,9 016 958

-2,5

6,25

5

272

264,763

7,2366

52,3 683 323

-1,5

2,25

6

298

275,977

22,0233

485,26 184

-0,5

0,25

7

313

287,19

25,81

666,157 303

0,5

0,25

8

324

298,403

25,5967

655,192 924

1,5

2,25

9

286

309,617

-23,617

557,741 439

2,5

6,25

10

314

320,83

-6,8298

46,6 466 711

3,5

12,25

11

344

332,043

11,9569

142,966 895

4,5

20,25

12

318

343,256

-25,256

637,886 259

5,5

30,25

сумма

4562,411

143

В нашем случае

= 6,5;; S = 21. 36

Результат запишем в виде таблицы

Месяц

t

1

1

219,91

11,60

194,32

245,50

6

6

275,98

6,23

262,23

289,72

12

12

343,26

11,60

317,67

368,84

На рисунке изображены график тренда, доверительные интервалы (для t=1,6,12), и доверительная полоса.

4. Найдем точечный прогноз для среднего объема продаж на конец первого квартала:

376. 85 тыс. у.е.

Аналогично пункту 3 решение запишем в виде таблицы:

Месяц

t

15

15

376,85

27,49

316,25

437,55

Задача 3

1. Для регрессионных моделей и с помощью критерия Дарбина — Уотсона проверить наличие или отсутствие автокорреляции на уровне значимости.

2. Для регрессионной модели проверить наличие или отсутствие мультиколлинеарности, используя:

а) парный коэффициент корреляции (приближенно);

б) критерий «хи-квадрат» на уровне значимости.

Решение:

Критерий Дарбина-Уотсона имеет вид

где — отклонения от линии регрессии, i=1,.n.

Проверим наличие или отсутствие автокорреляции для регрессионной модели:

Используя таблицу:

1

0,025

0,001

2

-0,036

-0,061

0,001

0,004

3

-0,013

0,023

0,000

0,001

4

-0,022

-0,009

0,000

0,000

5

0,069

0,091

0,005

0,008

6

-0,071

-0,140

0,005

0,019

7

0,161

0,232

0,026

0,054

8

-0,084

-0,245

0,007

0,060

9

0,069

0,153

0,005

0,023

10

-0,084

-0,153

0,007

0,023

11

-0,040

0,044

0,002

0,002

12

0,046

0,086

0,002

0,007

13

0,052

0,006

0,003

0,000

14

-0,148

-0,200

0,022

0,040

15

-0,031

0,117

0,001

0,014

16

0,104

0,135

0,011

0,018

Сумма квадратов

0,097

0,274

Находим

У нас n=16, m=2,, тогда =0,98 и =1,54.

Получаем, что выполняется условие: 4-< d <4 —, (2,46< 2,82< 3,02), то ничего нельзя сказать ни о присутствии и об отсутствии автокорреляции.

Для используя таблицу:

1

9,89 744

82,62 344

2

-24,1235

-33,2133

581,9453

1103,122

3

-25,3368

-1,21 329

641,9549

1,472 065

4

3,449 883

28,78 671

11,9017

828,6749

5

7,236 597

3,786 713

52,36 833

14,3392

6

22,2 331

14,78 671

485,0262

218,6469

7

25,81 002

3,786 713

666,1573

14,3392

8

25,59 674

-0,21 329

655,1929

0,45 491

9

-23,6166

-49,2133

557,7414

2421,948

10

-6,82 984

16,78 671

46,64 667

281,7937

11

11,95 688

18,78 671

142,9669

352,9406

12

-25,2564

-37,2133

637,8863

1384,829

Сумма квадратов

4562,411

6622,151

.

У нас n=12, m=1,, тогда =0,97 и =1,33.

Следовательно, условие < d< 4 — (1,33< 1,45<2,67) выполняется, значит, автокорреляция отсутствует.

2. Проверим наличие или отсутствие мультиколлинеарности для модели

а) Проверим значимость коэффициента:

Поэтому можно считать, что переменные x1 и x2 коррелируют между собой и, следовательно, мультиколлинеарность присутствует.

б) Вычислим определитель

Найдем наблюдаемое значение

Табличное значение при и степенями свободы составляет 3,84. Сравнивая < (27. 02>3. 84), приходим к выводу о наличии мультиколлеарности.

Список литературы

Эконометрика/ Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2001.

Практикум по эконометрике / Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2001.

ПоказатьСвернуть
Заполнить форму текущей работой