Парная и множественная корреляция

Тип работы:
Контрольная
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

Филиал в г. Уфе

Кафедра математики и информатики

КОНТРОЛЬНАЯ РАБОТА

по дисциплине «Эконометрика»

Исполнитель

Ишмухаметова Эльвира Айдаровна

специальность ФиК

группа 3дФК

№ зачетки 08ФФБ3 207

Преподаватель:

Анферов Михаил Анисимович

Уфа 2011

Содержание

1. Практическая задача 1

1.1 Условие и исходные данные

1.2 Решение задачи

2. Практическая задача 2

2.1 Условие и исходные данные

2.2 Решение задачи

1. Практическая задача 1

1.1 Условие и исходные данные

Условие задачи: По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (Х, млн. руб.) (табл. 1. 1).

Таблица 1.1 — Исходные данные: Х — объем капиталовложений (млн. руб.); Y — объем выпуска продукции (млн. руб.)

Обозначения

Числовые значения

1

2

3

4

5

6

7

8

Y

11,95 745

5,736 358

10,35 786

9,577 711

10,11 871

9,630 527

12,65 125

X

12,49 972

6,244 372

10,91 421

10,1779

10,48 216

10,55 336

13,481

Требуется:

1. Для характеристики Y от X построить следующие модели:

— линейную,

— степенную,

— показательную,

— гиперболическую.

2. Оценить каждую модель, определив:

— индекс корреляции,

— среднюю относительную ошибку,

— коэффициент детерминации,

— F-критерий Фишера.

3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

4. Рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10% относительно среднего уровня.

5. Результаты расчетов отобразить на графике.

1.2 Решение задачи

1. Построим для характеристики Y от X следующие модели:

Линейная модель парной регрессии

Построение уравнения регрессии сводится к оценке ее параметров.

Уравнение регрессии имеет вид:.

Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). Решая систему нормальных уравнений относительно, а и b:

получим следующие формулы:

.

Промежуточные расчеты проведем в Excel. В работе будем приводить таблицы на рабочих листах Excel. Значения параметров a и b определим, используя данные представленные в таблице 1.1.

Таблица 1.2 — Расчет параметров для линейной модели в Excel

t

y

x

y*x

x*x

1

11,95 745

12,49 972

149,46

156,243

1,95

3,81

1,95

3,79

3,80

11,95

0,00

2

5,736 358

6,244 372

35,82

38,99 218

-4,27

18,22

-4,31

18,57

18,39

5,64

0,01

3

10,35 786

10,91 421

113,05

119,12

0,35

0,13

0,36

0,13

0,13

10,35

0,00

4

9,577 711

10,1779

97,48

103,5896

-0,43

0,18

-0,38

0,14

0,16

9,61

0,00

5

10,11 871

10,48 216

106,07

109,8757

0,11

0,01

-0,07

0,01

-0,01

9,92

0,04

6

9,630 527

10,55 336

101,63

111,3734

-0,37

0,14

0,00

0,00

0,00

9,99

0,13

7

12,65 125

13,481

164,53

169,1251

2,65

7,01

2,45

6,01

6,49

12,46

0,03

Итого

70,2 987

73,87 653

768,041

808,319

0,00

29,50

28,64

28,96

0,21

Ср. знач.

10,00

10,55

109,72

115,47

Отсюда получаем:

b=;

а =.

Уравнение линейной регрессии имеет вид:

.

Степенная модель

Уравнение степенной модели имеет вид:

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

.

Обозначим

Тогда уравнение примет вид: — линейное уравнение регрессии.

Таблица 1.3 — Расчет параметров для степенной модели в Excel

t

y

Y

x

X

Y*X

X2

1

11,95 745

1,77 639

12,49 972

1,0969

1,182 062 058

1,20 319

11,96

-0,01

0,0000

3,81

2

5,736 358

0,758 636

6,244 372

0,795 489

0,603 486 614

0,632 802

5,71

0,03

0,0009

18,22

3

10,35 786

1,1 527

10,91 421

1,37 992

1,53 842 486

1,77 428

10,35

0,01

0,0000

0,13

4

9,577 711

0,981 262

10,1779

1,7 658

0,988 776 407

1,15 375

9,61

-0,03

0,0009

0,18

5

10,11 871

1,5 125

10,48 216

1,20 451

1,25 680 747

1,4 132

9,91

0,20

0,0415

0,01

6

9,630 527

0,98 365

10,55 336

1,23 391

1,6 658 369

1,47 329

9,99

-0,36

0,1269

0,14

7

12,65 125

1,102 133

13,481

1,114 104

1,227 891 284

1,241 228

12,48

0,17

0,0296

7,01

Итого

70,2 987

6,923 715

73,87 653

7,95 985

7,88 397 965

7,258 672

0,02

0,2000

29,50

срзнач

10,00

0,99

10,55

1,01

1,01

1,0370

Рассчитаем его параметры, используя данные, приведенные в таблице 1. 3:

Уравнение линейной регрессии имеет вид:

Перейдем к исходным переменным х и y, выполнив потенцирование данного уравнения, получим уравнение степенной модели регрессии:

=0,81*

Показательная модель

Уравнение показательной кривой:

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

.

Обозначим

Получим линейное уравнение регрессии:.

Таблица 1.4 — Расчет параметров для показательной модели в Excel

t

y

Y

x

Y*x

x*x

1

11,95 745

1,77 639

12,49 972

13,47 018

156,243

12,24

-0,29

0,08

3,81

2

5,736 358

0,758 636

6,244 372

4,737 207

38,99 218

5,89

-0,16

0,02

18,22

3

10,35 786

1,1 527

10,91 421

11,8 087

119,12

10,17

0,19

0,03

0,13

4

9,577 711

0,981 262

10,1779

9,987 184

103,5896

9,33

0,24

0,06

0,18

5

10,11 871

1,5 125

10,48 216

10,53 588

109,8757

9,67

0,45

0,20

0,01

6

9,630 527

0,98 365

10,55 336

10,38 081

111,3734

9,75

-0,12

0,01

0,14

7

12,65 125

1,102 133

13,481

14,33 304

169,1251

12,99

-0,34

0,11

7,01

Итого

70,2 987

6,923 715

73,87 653

511,5001

808,319

-0,02

0,53

29,50

срзнач

10,00

0,99

10,55

10,65

115,47

Рассчитаем его параметры, используя данные, приведенные в таблице 1. 4:

Уравнение линейной регрессии имеет вид:

Перейдем к исходным переменным х и y, выполнив потенцирование данного уравнения:

.

Гиперболическая функция

Уравнение гиперболической функции:.

Произведем линеаризацию модели путем замены

.

В результате получим линейное уравнение. Рассчитаем его параметры, используя данные, приведенные в таблице 1.5.

Таблица 1.5 Расчет параметров для гиперболической модели в Excel

t

y

x

X

y *X

X*X

1

11,95 745

12,49 972

0,80 002

0,96

0,0064

11,96

-0,01

0,000

3,81

2

5,736 358

6,244 372

0,160 144

0,92

0,0256

5,71

0,03

0,001

18,22

3

10,35 786

10,91 421

0,91 624

0,95

0,0084

10,35

0,01

0,000

0,13

4

9,577 711

10,1779

0,98 252

0,94

0,0097

9,61

-0,03

0,001

0,18

5

10,11 871

10,48 216

0,0954

0,97

0,0091

9,91

0,20

0,042

0,01

6

9,630 527

10,55 336

0,94 757

0,91

0,0090

9,99

-0,36

0,127

0,14

7

12,65 125

13,481

0,76 895

0,97

0,0059

12,48

0,17

0,030

7,01

Итого

70,2 987

73,87 653

0,697 073

6,62

0,0741

0,02

0,200

29,50

срзнач

10,00

10,55

0,10

0,95

0,0106

Получим следующее уравнение гиперболической модели:

2. Оценим каждую модель и составим сводную таблицу вычислений, определив: индекс корреляции по следующей модели:

Для линейной модели можно вычислить линейный коэффициент парной корреляции по следующей формуле:

Данные для вычислений возьмем из таблиц 1.2. — 1.5. соответственно.

Стандартная ошибка равна:

.

По условию задачи количество наблюдений, количество факторов.

Среднюю относительную ошибку рассчитаем по формуле:

.

Коэффициент детерминации равен:

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

.

3. Для выбора лучшей модели построим сводную таблицу результатов (табл. 1. 6).

Таблица 1.6 — Сводная таблица результатов

Параметры Модель

Индекс корреляции (линейный коэффициент)

Стандартная ошибка

Средняя относительная ошибка

Коэффициент детерминации

F — критерий Фишера

Линейная

0,996

0,207

1,332%

0,9928

686,678

Степенная

0,997

0,200

1,147%

0,9932

732,467

Показательная

0,991

0,325

2,545%

0,9821

274,137

Гиперболическая

0,964

0,650

5,023%

0,9285

64,911

Выберем лучшую модель и дадим интерпретацию рассчитанных характеристик.

Степенная модель имеет меньшее значение стандартной ошибки, а также большее значение F — критерий Фишера и большее значение коэффициента детерминации R2. Ее можно взять в качестве лучшей модели для построения прогноза.

Значение средней относительной ошибки говорит о том, что в среднем расчетные значения для степенной функции отличается от фактических на 1,15%.

Связь между показателем у и фактором х можно считать весьма тесной, т.к. индекс корреляции примерно равен 0,997.

Коэффициент детерминации равен 0,9932, следовательно, вариация результата Y (объема выпуска продукции) на 99,32% объясняется вариацией фактора X (объемом капиталовложений).

для =0,05;

Т.к., то уравнение регрессии с вероятностью 0,95 в целом статистически значимо.

4. Рассчитаем прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10% относительно максимального уровня.

следовательно,

(млн. руб.).

Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению степенной функции, подставив в него планируемую величину объема капиталовложений:

(млн. руб.).

Для построения интервального прогноза рассчитаем доверительный интервал. Примем значение уровня значимости =0,05; следовательно, доверительная вероятность равна 95%, а критерий Стьюдента при равен 2,57.

Ширину доверительного интервала вычислим по формуле:

.

Интервальный прогноз найдем по следующей формуле:

.

Верхняя граница равна: 14,472 (млн. руб.)

Нижняя граница: 13,157 (млн. руб.).

Фактические, расчетные и прогнозные значения по лучшей модели отобразим на графике (рис. 1. 5).

5. Результаты расчетов отобразим на графике.

Рисунок 1.1. — Прогноз по лучшей (степенной) модели: х — объем капиталовложений, млн. руб.; y — объем выпуска продукции, млн. руб.

капиталовложение регрессия корреляция

2. Практическая задача 2

2.1 Условие и исходные данные

Условие задачи: По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (X1), ставки по депозитам (Х2) и размера внутрибанковских расходов (Х3) (табл. 2. 1).

Таблица 2.1 — Исходные данные: X1 — среднегодовой ставки по кредитам; Х2 -ставка по депозитам; Х3 — размер внутрибанковских расходов; Y — объема прибыли

Y

X1

X2

X3

39,9573

136,8263

82,66 037

-48,04

-45,4157

-247,619

-173,312

106,7567

-10,6174

-80,474

-60,3473

38,55 368

-35,4631

-208,994

-149,167

93,46 888

-91,4663

-405,57

-273,035

167,3665

-91,4241

-358,422

-234,767

142,3765

-92,0873

-360,689

-233,722

138,7201

-40,6464

-202,06

-140,801

86,66 781

-90,392

-369,868

-244,584

149,9707

45,47 677

127,4481

72,91 611

-39,653

Требуется:

1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.

2. Рассчитать параметры модели.

3. Для характеристики модели определить:

— линейный коэффициент множественной корреляции,

— коэффициент детерминации,

— средние коэффициенты эластичности,

— бета —, дельта — коэффициенты.

Дать их интерпретацию.

4. Осуществить анализ остатков (график и оценка с использованием d-критерия Дарбина-Уотсона).

5. Осуществить оценку надежности уравнения регрессии.

6. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.

7. Построить точечный и интервальный прогнозы результирующего показателя.

8. Отразить результаты расчетов на графике.

2.2 Решение задачи

1. Осуществим выбор факторных признаков для построения двухфакторной регрессионной модели:

Проведем корреляционный анализ, используя инструмент Корреляция (Анализ данных в Excel) (табл. 2. 2).

Таблица 2.2 — Результат корреляционного анализа

Объем прибыли, Y

Среднегодовая ставка по кредитам, X1

Ставка по депозитам, X2

Размер внутрибанковских расходов, X3

Y

1

X1

0,992 657

1

X2

0,988 145

0,999 443

1

X3

-0,9856

-0,99 868

-0,99 978

1

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т. е. объем прибыли имеет весьма тесную связь со среднегодовой ставки по кредитам (Х1).

Х2 и Х3 весьма тесно связаны между собой (), что свидетельствует о наличии мультиколлинеарности. Целесообразно включить фактор Х3,, а не Х2, так как слабее межфакторная корреляция. Поэтому для построения двухфакторной регрессионной модели из трех переменных оставим в модели Х1 и Х3.

В итоге получаем двухфакторную модель с факторами Х1 (Среднегодовая ставка по кредитам) и Х3 (Размер внутрибанковских расходов).

2. Рассчитаем параметры модели:

Оценка параметров регрессии осуществляется по методу наименьших квадратов по формуле:

.

Таблица 2.3 — Исходные данные двухфакторной модели

t

Y

X0

X1

X2

Объем прибыли

Среднегодовая

ставка по кредитам

Размер внутрибанковских расходов

1

39,9573

1

136,8263

-48,04

2

-45,4157

1

-247,619

106,7567

3

-10,6174

1

-80,474

38,55 368

4

-35,4631

1

-208,994

93,46 888

5

-91,4663

1

-405,57

167,3665

6

-91,4241

1

-358,422

142,3765

7

-92,0873

1

-360,689

138,7201

8

-40,6464

1

-202,06

86,66 781

9

-90,392

1

-369,868

149,9707

10

45,47 677

1

127,4481

-39,653

Среднее значение

-41,208

-196,942

83,619

средн. кв. отклонение

фактора

52,85 639 511

0

199,7 922 608

76,81 680 715

Используя данные, приведенные в таблице 2. 3, и применив инструмент Регрессия (Анализ данных в Excel) (табл. 2. 4), получим следующие коэффициенты:

.

Таблица 2.4 — Параметры модели

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

-1,46 328

2,25 426

-0,64 912

Переменная X 1

0,837 544

0,89 814

9,325 316

Переменная X 2

1,497 309

0,233 597

6,409 807

Уравнение регрессии зависимости объема прибыли от ставки по депозитам и среднегодовой ставки по кредитам можно записать в следующем виде:

.

Расчетные значения Y определяются путем подстановки в эту модель значений факторов, взятых для каждого наблюдения.

3. Для характеристики модели определим следующие показатели и дадим их интерпретацию:

линейный коэффициент множественной корреляции вычисляется по формуле:

,

но мы воспользуемся инструментом Регрессия (Анализ данных в Excel) (табл. 2. 5).

; что говорит о том, что связь между факторами прямая и весьма тесная.

Коэффициент детерминации равен (табл. 2. 5). Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,787% изменений в объеме прибыли учтено в модели и обусловлено влиянием среднегодовой ставки по кредитам и размер внутрибанковских расходов.

Таблица 2.5 — Регрессионная статистика

Регрессионная статистика

Множественный R

0,998 934

R-квадрат

0,99 787

Нормированный R-квадрат

0,997 261

Стандартная ошибка

2,766 169

Наблюдения

10

Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем средний коэффициент эластичности:

.

Для расчета коэффициентов используем данные из таблицы 2.3 и 2.4 соответственно.

.

Следовательно, наименьшее влияние на объем прибыли оказывает размер внутрибанкоских расходов. При неизменном размере внутрибанковских расходов объем прибыли с ростом размера среднегодовой ставки по кредитам на 1% увеличится в среднем на 4,003%, тогда как с уменьшением размера внутрибанковских расходов на 1% объем прибыли в среднем по совокупности кредитных учреждений сократится на 3,038% при неизменном размере среднегодовых ставок по кредитам.

Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значений остальных независимых переменных:

,

где (табл. 2. 3),

;

Это означает, что размер внутрибанковских расходов оказывает меньшее влияние на объем прибыли, т.к. при ее увеличении на 76,82 руб., объем прибыли уменьшится на 115,02 руб. (2,176*52,856), тогда как при росте среднегодовой ставки по кредитам на 199,79 руб., объем прибыли увеличится на 116,33 руб. (3,166*52,856).

Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта — коэффициентов:

(табл. 2. 2, 2. 5)

;.

Это означает, что среднегодовая ставка по кредитам в суммарном влиянии всех факторов имеет большее влияние на объем прибыли, чем размер внутрибанковских расходов.

4. График остатков приведен на рисунке 2.1.

Рисунок 2.1 — График остатков: t -наблюдение, e -остатки.

Проверку независимости проведем с помощью d-критерия Дарвина-Уотсона.

Воспользуемся инструментом Регрессия (Анализ данных в Excel) (табл. 2. 6):

Таблица 2.6 — Вывод остатка

Наблюдение

Предсказанное Y

Остатки

1

41,20 403 499

-1,246 735

1,554 348 146

2

-49,729 684

3,59 159 684

23,40 945 494

12,89 956 786

3

-11,13 701 388

0,51 961 388

9,437 079 304

0,269 998 585

4

-36,55 313 533

1,9 003 533

0,325 380 629

1,188 177 018

5

-90,54 659 771

-0,9 197 023

4,39 045 285

0,845 852 297

6

-88,47 582 896

-2,948 271

4,115 091 181

8,692 302 119

7

-95,84 930 175

3,76 200 175

45,2 776 087

14,15 265 715

8

-40,92 890 918

0,28 250 918

12,10 686 852

0,79 811 438

9

-86,69 149 261

-3,7 005 074

15,86 442 099

13,69 375 493

10

45,90 731 127

-0,4 305 413

10,69 267 841

0,185 365 785

125,177 801

53,56 183 532

В качестве критических табличных уровней при N=10, двух объясняющих факторах при уровне значимости в 5% при k=2 возьмем табличные величины d1=0,70 и d2=1,64.

Значение сравнивают с табличными значениями d1 и d2.

Т.к. dw > 2, это свидетельствует о наличии отрицательной корреляции. dw= 4 — dw= 4 — 2,33= 1,67

При сравнении расчетного значения dw статистики с табличным:

— ряд остатков не коррелирован.

5. Осуществим оценку надежности уравнения регрессии с помощью F-критерия Фишера:

.

Значение F-критерия Фишера можно найти с помощью инструмента Регрессия (Анализ данных в Excel): (табл. 2. 7).

Таблица 2.7 — Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

25 090,62

12 545,31

1639,548

4,46E-10

Остаток

7

53,56 184

7,651 691

Итого

9

25 144,19

Табличное значение F-критерия можно найти с помощью функции FРАСПОБР: при доверительной вероятности 0,95 при и составляет 4,737.

Поскольку, уравнение регрессии следует признать адекватным.

6. Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии:

где — коэффициенты в матрице.

Воспользуемся инструментом Регрессия (Анализ данных в Excel (табл. 2. 4):

.

Табличное значение t-критерия Стьюдента можно найти с помощью функции СТЬЮДРАСПОБР; при уровне значимости 5% и степенях свободы составляет 2,365.

Т.к. для двух коэффициентов, то коэффициенты и существенны (значимы).

7. Построим точечный и интервальный прогнозы результирующего показателя.

Прогнозные значения Х1,11, Х2,11 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов.

В качестве аппроксимирующей функции выберем полином второй степени (парабола), по которой построим прогноз на один шаг вперед.

Уравнение фактора — Среднегодовая ставка по кредитам:

и прогнозное значение.

Уравнение для Размера внутрибанковских расходов выглядит следующим образом:

.

Подставляя в него вместо, получим прогнозное значение среднегодовой ставки по кредитам.

Отобразим результаты расчетов на графике (рис. 2. 2; рис. 2. 3).

Для получения прогнозных оценок зависимостей переменной по модели

Подставим в нее найденные прогнозные значения факторов Х1 и Х2.

.

Доверительный интервал прогноза будет иметь следующие границы:

Верхняя граница прогноза:.

Нижняя граница прогноза:.

.

— стандартная ошибка, найдена с помощью инструмента Регрессия (Анализ данных в Excel) (табл. 2. 5).

tкр = 2,365 (найдено выше с помощью функции СТЬЮРАСПРОБР).

Тогда получаем. U (1)= 4,699 240 149

Результаты прогнозных оценок модели регрессии представим в таблице 2.8.

Таблица 2.8 — Таблица прогнозов (р=95%)

Упреждение

Прогноз

Нижняя граница

Верхняя граница

1

58,66 008

53,96 084 237

63,35 932 267

8.

Рисунок 2.2 — Прогноз показателя Среднегодовая ставка по кредитам:

t — количество кредитных учреждений, Х1 -Среднегодовая ставка по кредитам

Рисунок 2.3 — Прогноз показателя Размер внутрибанковских расходов: t — количество кредитных учреждений, Х3 — Размер внутрибанковских расходов

ПоказатьСвернуть
Заполнить форму текущей работой