Описательная статистика.
Частоты

Тип работы:
Курсовая
Предмет:
Экономика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Содержание

1. Описательная статистика. Частоты

2. Корреляция

3. Линейная и нелинейная регрессия

4. Дисперсионный анализ

5. Дискриминантный анализ

6. Кластерный анализ

7. Линейное программирование

8. Параметрические и непараметрические критерии

1. Описательная статистика. Частоты

Для показателей: уровень рентабельности, прибыль, полная себестоимость, цена реализации, рассчитать среднее значение, max, min, размах, эксцесс, асимметрию, дать интерпретацию каждому параметру.

Таблица 1 — Описательная статистика

N

Размах

Minimum

Maximum

Среднее

Среднее отклонение

Дисперсия

Ассимметрия

Эксцесс

Statistic

Statistic

Statistic

Statistic

Statistic

Стат. велич

Стат. велич

Стат. велич

Станд. ош

Стат. велич.

Станд. ош

Уровень рентабельности

91

279

-64,55

214,6

31,45

45,95

2111,70

1,216

0,2

3,9

0,5

Прибыль убыток тыс. /руб.

91

10 410

-76 664

27 440

1790

10 648

113 400

-4,337

0,2

33

0,5

Полная себестоимость за 1 ц/руб.

91

1017

89,79

1107

392,3

157

24 850

1,785

0,2

4,9

0,5

Средняя цена реализации за 1 ц/руб.

91

879

164,52

1043

471,1

142,2

20 245

1,19

0,2

2,3

0,5

Анализ представлен за 2008−2009 год по 91 предприятию по Верхнеуральскому, Варненскому, Октябрьскому районам. Нами были рассчитаны показатели: рентабельность, средняя цена реализации, прибыль и полная себестоимость. Таким образом:

Ср. значение по уровню рентабельности 31,46; по прибыли 1790,6; по полной себестоимости 392,37; по ср. цене реализации 471,2.

Max по уровню рентабельности 214,0036; по прибыли 27 440, по полной себестоимости 1107,3; по ср. цене реализации 1043,7.

Min по уровню рентабельности -64,5; по прибыли -76 664; по полной себестоимости 89,8; по ср. цене реализации 164,5.

Размах по уровню рентабельности 279,2; по прибыли 104 104; по полной себестоимости 1017,5; по ср. цене реализации 879,1.

Эксцесс по уровню рентабельности 3,91 (полновершинное распределение); по прибыли 33,7 (полновершинное распределение); по полной себестоимости 4,9 (полновершинное распределение); по ср. цене реализации 2,4 (полновершинное распределение).

Асимметрия по уровню рентабельности 1,2 (сдвиг в сторону меньших значений, т. е. предприятия с меньшей рентабельностью); по прибыли -4,33 (сдвиг в сторону больших значений, т. е. предприятия с большей рентабельностью); по полной себестоимости 1,78 (сдвиг в сторону меньших значений, т. е. предприятия с меньшей рентабельностью); по ср. цене реализации 1,19 (сдвиг в сторону меньших значений, т. е. предприятия с меньшей рентабельностью).

1) Построить гистограмму распределения уровня рентабельности на предприятии;

2) Построить гистограмму прибыли и убытков;

3) Сформировать гистограмму средняя цена реализации;

4) Построить столбиковую диаграмму полной себестоимости.

Таблица 2 — Средняя цена реализации за 1ц/руб.

Ведомство

Среднее

Кол-во предпр.

Стандарт, отклонение

Медиана

Варненский район

506,939 517 632 340 300

28

126,42 600 783 486 530

484,88 987 040 895 200

Верхнеуральский район

410,536 216 344 213 240

29

96,888 364 694 753 300

400,347 372 991 749 860

Октябрьский район

493,490 505 325 712 600

34

171,529 677 556 912 000

453,785 062 517 926 100

Общее кол-во

471,192 680 755 625 800

91

142,287 229 951 379 860

436,488 970 588 235 250

В таблице 2 представлены средние значения цены реализации 1 тонны пшеницы по предприятиям Варненского района — 506,9 р., Верхнеуральского района — 410,5 р. и Октябрьского района — 493,5 р. за 2008−2009 год.

1) На графике представлен уровень рентабельности предприятия, и он приближен к нормальному распределению.

Рисунок 1 — Уровень рентабельности

регрессия корреляция программирование рентабельность

2) На графике представлены прибыли и убытки, анализируемые данные распределены по нормальному распределению.

Рисунок 2 — Прибыли и убытков

3) На графике представлена средняя цена реализации, анализируемые данные распределены по нормальному распределению.

Рисунок 3 — Средняя цена реализации за 1 ц/руб.

4) На графике представлена полная себестоимость, анализируемые данные распределены по нормальному распределению.

Рисунок 4 — Полная себестоимость за 1 ц/руб.

Рассматривалась столбиковая гистограмма по полной себестоимости. Шкала от 90 до 1100 рублей. Из полученных данных можно сделать вывод о том, что приблизительно в у 20 предприятий себестоимость за 1ц составила 400 руб. В среднем у 4-х предприятий данный показатель составил 200 руб., у 7-ми — 250 руб., у 10-ти — 350 руб., у 9-ти — 500 руб., у 2-х — 600 руб., у 3-х — 800 руб.

2. Корреляция

1) Определить существует ли взаимосвязь между рентабельностью и затратами на рекламу;

2) Определить существует ли взаимосвязь между затратами на содержание основных средств и урожайностью, рентабельностью;

3) Определить существует ли взаимосвязь между затратами на ГСМ и рентабельностью.

Таблица 3 — Связь между рентабельностью и затратами на рекламу

Рентабельность

Затраты на рекламу, руб.

Рентабельность

Корреляция Пирсона

1

0,430**

Sig. (2-tailed)

0,002

Кол-во

48

48

Затраты на рекламу, руб.

Корреляция Пирсона

0,430**

1

Sig. (2-tailed)

0,002

Кол-во

48

48

Между рентабельностью и затратами существует взаимосвязь, но она незначительная, так как отдалена от коэффициента 1, и она составляет 0,43. Между двумя признаками образована прямая связь. Следовательно, при увеличении одного признака, увеличивается и второй признак.

Таблица 4 — Взаимосвязь между затратами на содержание ОС и урожайностью.

Основные средства

Урожайность пшеницы, ц/га

Основные средства

Корреляция Пирсона

1

-0,113

Sig. (2-tailed)

0,372

Кол-во

64

64

Урожайность пшеницы, ц/га

Корреляция Пирсона

-0,113

1

Sig. (2-tailed)

0,372

Кол-во

64

64

Между урожайностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен -0,113. Связь обратная, с увеличением одного фактора происходит уменьшение второго фактора.

Таблица 5 — Взаимосвязь между затратами на содержание ОС и рентабельностью.

Основные средства

Рентабельность

Основные средства

Корреляция Пирсона

1

-0,161

Sig. (2-tailed)

0,204

Кол-во

64

64

Рентабельность

Корреляция Пирсона

-0,161

1

Sig. (2-tailed)

0,204

Кол-во

64

64

Между рентабельностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен — 0,161. Связь обратная, с увеличением значения одного фактора происходит уменьшение значения второго фактора.

Таблица 6 — Связь между затратами на ГСМ и рентабельностью.

Затраты на ГСМ 1цруб

Рентабельность

Затраты на ГСМ 1ц руб.

Корреляция Пирсона

1

-0,181

Sig. (2-tailed)

0,103

Кол-во

82

82

Рентабельность

Корреляция Пирсона

-0,181

1

Sig. (2-tailed)

0,103

Кол-во

82

82

Между рентабельностью и затратами на ГСМ очень слабая взаимосвязь, так как коэффициент равен — 0,181. Связь обратная, поэтому с увеличением значения одного фактора происходит уменьшение значения второго фактора.

3. Линейная и нелинейная регрессия

Требуется построить модель зависимости объема прибыли от премиальных выплат с помощью полинома 2-й степени. Исходные данные и результаты расчетов отобразить на графике.

Таблица 7

у

x1

x2

x3

x4

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,725

0,872

0,854

0,021

0,486

x1

0,203

1,000

0,101

0,069

0,100

-0,194

-0,023

x2

0,725

0,101

1,000

0,809

0,891

-0,016

0,222

x3

0,872

0,069

0,809

1,000

0,955

0,084

0,633

x4

0,854

0,100

0,891

0,955

1,000

0,002

0,506

x5

0,021

-0,194

-0,016

0,084

0,002

1,000

0,150

x6

0,486

-0,023

0,222

0,633

0,506

0,150

1,000

Построив матрицу парных коэффициентов корреляции, мы анализируем коллинеарность факторов. Мы видим, что между фактором х1 и у существует слабая взаимосвязь, коэффициент равен 0,203. между фактором х2 и у существует сильная взаимосвязь, коэффициент равен 0,725. Между факторами х2 и х3 существует очень сильная взаимосвязь. Также фактор х3 сильно взаимодействует с факторами х4 и х6, и фактор х2 сильно взаимодействует с х4, поэтому исключим x2 и x4.

Model

R

R Square

1

0,889a

0,791

В результате анализа мы получили коэффициент корреляции, который равен 0,889, а коэффициент детерминации равен 0,791. Коэффициент корреляции говорит нам о том, что между зависимым фактором У и независимыми факторами Х существует очень сильная взаимосвязь. Благодаря коэффициенту детерминации мы можем сказать, что фактор У находится под влиянием практических всех независимых факторов. Модель адекватна и качественна.

Таблица 8

Model

Нестандартизир. коэф-ты

Стандартиз. коэф-ты

Стат-ка коллинеар-ти

B

Std. Error

Beta

Tolerance

VIF

1

(Constant)

-15,320

17,190

x1

14,215

5,930

0,132

0,950

1,053

x2

-7,614

7,033

-0,158

0,135

7,412

x3

1,507

0,409

0,836

0,056

17,917

x4

0,714

0,720

0,249

0,045

22,036

x5

-0,087

0,786

-0,006

0,892

1,122

x6

-2,403

1,657

-0,130

0,355

2,814

Модель множественной линейной регрессии:

У= -15,3+14,2×1−7,6×2+1,5×3+0,7×4−0,087×5−2,4х6

Таблица 9

у

x1

x3

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,872

0,021

0,486

x1

0,203

1,000

0,069

-0,194

-0,023

x3

0,872

0,069

1,000

0,084

0,633

x5

0,021

-0,194

0,084

1,000

0,150

x6

0,486

-0,023

0,633

0,150

1,000

Таблица 10

Model

Нестандартиз. коэф-ты

Стат-ка коллинеарн-ти

B

Std. Error

Tolerance

VIF

1

(Constant)

-23,026

14,680

x1

14,418

5,899

0,951

1,051

x3

1,664

0,125

0,593

1,687

x5

-0,219

0,762

0,941

1,063

x6

-1,715

1,283

0,588

1,701

Модель множественной линейной регрессии:

У= -23,026+14,4×1+1,66×3−0,21×5−1,71х6

На формирование цены квартиры, значимо влияет фактор x3-общая площадь квартиры, также фактором, оказывающим сильное влияние на формирование цены является фактор x6 площадь кухни.

Таблица 11

Parameter Estimates

Parameter

Estimate

Std. Error

95% Confidence Interval

Lower Bound

Upper Bound

a0

-712,105

54,372

-837,486

-586,724

a1

2,391

0,151

2,042

2,740

a2

-0,002

0,000

-0,002

-0,001

Y=-712,105+2,391×1−0,002x2

Рисунок 5

По мере увеличения премиальных выплат работникам увеличивается прибыль от реализации, достигается максимальный пик увеличения, после чего при увеличении выплат происходит спад прибыли. Максимальная точка (710; 155).

Рисунок 6

По мере увеличения премиальных выплат увеличиваются предсказуемые значения. После достижения максимальной точки происходит спад.

4. Дисперсионный анализ

По результатам испытаний требуется выяснить: а) значимы ли различия в средней урожайности различных сортов пшеницы, независимо от типа удобрения. б) значимо ли влияние типа применяемого удобрения на урожайность, независимо от сорта.

Выдвинем две нулевые гипотезы: 1) различия в средней урожайности пшеницы, вызванные влиянием типа удобрения (фактор А), выраженные не более, чем различия, обусловленные случайными причинами. 2) различия в средней урожайности пшеницы, вызванные влиянием сорта (фактор Б), выраженные не более, чем различия, обусловленные случайными причинами.

Таблица 12

Source

Type III Sum of Squares

df

Mean Square

F

Sig.

Partial Eta Squared

Corrected Model

2474,450a

9

274,939

6,162

0,000

0,735

16 008,300

1

16 008,300

358,780

0,000

0,947

Удобрения

1875,500

5

375,100

8,407

0,000

0,678

Сорт

598,950

4

149,738

3,356

0,030

0,402

Error

892,375

20

44,619

Total

19 375,125

30

Corrected Total

3366,825

29

a. R Squared =, 735 (Adjusted R Squared =, 616)

Таблица оценки эффектов межгрупповых факторов содержит результаты проверки основных гипотез дисперсионного анализа: 1) переменная удобрения оказывает статистическое достоверное влияние на распределение зависимых переменных урожайности, поскольку F=8,4(табл. F-критерия) и при расчетном значении 0,00; 2) переменная сорт оказывает статистически значимое влияние на урожайность, поскольку F-табличное=3,35, расчетная = 0,03. В результате и сорт, и удобрения оказывают достоверное влияние на переменную (урожайность).

Таблица 13 — Многократные сравнения

Зависимая переменная: Урожайность

(I) Удобрения

(J) Удобрения

Mean Difference (I-J)

Std. Error

Sig.

95% Confidence Interval

Lower Bound

Upper Bound

Удобрения А

Удобрения Б

1,1000

4,22 463

1,000

-14,4536

16,6536

Удобрения В

-2,2000

4,22 463

, 998

-17,7536

13,3536

Удобрения Г

-6,0500

4,22 463

, 836

-21,6036

9,5036

Удобрения Д

-18,1500*

4,22 463

, 016

-33,7036

-2,5964

Удобрения Е

-17,6000*

4,22 463

, 020

-33,1536

-2,0464

Удобрения Б

Удобрения А

-1,1000

4,22 463

1,000

-16,6536

14,4536

Удобрения В

-3,3000

4,22 463

, 986

-18,8536

12,2536

Удобрения Г

-7,1500

4,22 463

, 720

-22,7036

8,4036

Удобрения Д

-19,2500*

4,22 463

, 009

-34,8036

-3,6964

Удобрения Е

-18,7000*

4,22 463

, 012

-34,2536

-3,1464

Удобрения В

Удобрения А

2,2000

4,22 463

, 998

-13,3536

17,7536

Удобрения Б

3,3000

4,22 463

, 986

-12,2536

18,8536

Удобрения Г

-3,8500

4,22 463

, 972

-19,4036

11,7036

Удобрения Д

-15,9500*

4,22 463

, 042

-31,5036

-, 3964

Удобрения Е

-15,4000

4,22 463

, 053

-30,9536

, 1536

Удобрения Г

Удобрения А

6,0500

4,22 463

, 836

-9,5036

21,6036

Удобрения Б

7,1500

4,22 463

, 720

-8,4036

22,7036

Удобрения В

3,8500

4,22 463

, 972

-11,7036

19,4036

Удобрения Д

-12,1000

4,22 463

, 195

-27,6536

3,4536

Удобрения Е

-11,5500

4,22 463

, 236

-27,1036

4,0036

Удобрения Д

Удобрения А

18,1500*

4,22 463

, 016

2,5964

33,7036

Удобрения Б

19,2500*

4,22 463

, 009

3,6964

34,8036

Удобрения В

15,9500*

4,22 463

, 042

, 3964

31,5036

Удобрения Г

12,1000

4,22 463

, 195

-3,4536

27,6536

Удобрения Е

, 5500

4,22 463

1,000

-15,0036

16,1036

Удобрения Е

Удобрения А

17,6000*

4,22 463

, 020

2,0464

33,1536

Удобрения Б

18,7000*

4,22 463

, 012

3,1464

34,2536

Удобрения В

15,4000

4,22 463

, 053

-, 1536

30,9536

Удобрения Г

11,5500

4,22 463

, 236

-4,0036

27,1036

Удобрения Д

-, 5500

4,22 463

1,000

-16,1036

15,0036

В таблице 14 представлены результаты расчета теста Шеффе. По результатам теста можно увидеть, что удобрения Е и Д наиболее значимы по своему воздействию на урожайность пшеницы. Чем больше значение теста, тем меньше вклад, той или иной комбинации.

Таблица 14 — Урожайность

Удобрения

N

Subset

1

2

3

Удобрения Б

5

14,8500

Удобрения А

5

15,9500

Удобрения В

5

18,1500

18,1500

Удобрения Г

5

22,0000

22,0000

22,0000

Удобрения Е

5

33,5500

33,5500

Удобрения Д

5

34,1000

Sig.

, 720

, 053

, 195

Выделяются три объекта и 3 группы: 1 группа (наименьшее воздействие), 2 группа (среднее воздействие), 3 группа (те удобрения, которые оказывают наибольшее воздействие).

Группа удобрений Г Е и Д оказывают наибольшее влияние на урожайность, а группа Б, А В Г оказывают наименьшее влияние на урожайность.

Таблица 15 — Урожайность

Сорт

N

Subset

1

2

Сорт 4

6

16,5000

Сорт 2

6

22,0000

22,0000

Сорт 5

6

22,0000

22,0000

Сорт 1

6

24,7500

24,7500

Сорт 3

6

30,2500

Sig.

, 365

, 365

Выделяются 2 группы: 1 группа (оказывает наименьшее воздействие), 2 группа (оказывает наибольшее воздействие). Сорт оказывает меньше влияния, чем удобрения (внесение гербицидов). И сорта и удобрения одновременно могут входить в одну или несколько групп.

Рис. 7

Из данного графика видно, что наибольший эффект на среднюю урожайность оказывает влияние удобрения Д и Е, наименьший эффект удобрение, А и Б. Если рассмотреть влияние сорта, можно заметить, что наиболее урожайным является сорт 3, наименее сорт 4. Поскольку сорта 2 и 5 имеют одинаковые средние значения, то соответственно две линии слились в одну.

5. Дискриминантный анализ

Имеются данные по 2-м группам сельскохозяйственных предприятий отраслей:

x1 — среднегодовая стоимость основных производственных фондов;

x2 — среднесписочная численность персонала;

x3 — балансовая прибыль.

Требуется провести классификацию (дискриминацию) 3-х новых предприятий.

Таблица 16. Групповые статистики

Группы

Среднее

Стд. отклонение

Кол-во валидных (искл. целиком)

Невзвешенные

Взвешенные

1

Стоимость ОПФ

168,90 525

36,949 497

4

4,000

Персонал

14,4 775

2,743 931

4

4,000

Прибыль

18,33 250

5,709 310

4

4,000

2

Стоимость ОПФ

45,79 060

13,501 905

5

5,000

Персонал

4,77 800

, 681 709

5

5,000

Прибыль

10,75 800

2,681 023

5

5,000

Итого

Стоимость ОПФ

100,50 822

69,379 127

9

9,000

Персонал

8,89 789

5,188 907

9

9,000

Прибыль

14,12 444

5,635 112

9

9,000

Приводится среднее значение, стандартное отклонение, и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй.

Таблица 17. Критерий равенства групповых средних

Лямбда Уилкса

F

ст. св1

ст. св2

Знч.

Стоимость ОПФ

, 125

48,866

1

7

, 000

Персонал

, 113

54,677

1

7

, 000

Прибыль

, 498

7,053

1

7

, 033

Результаты теста на значимость между переменными, находящимися в разных группах приведены в таблице, критерии равенства групповых средних, с помощью этих данных выясняется существенность различий (т.е. присутствует ли разделяющие способности) в данном примере получены весьма значимые различия между группами. Каждый из факторов дискриминирует данную совокупность, так как они меньше 0,5. Все 3 фактора используются, и оказывают влияние на дискриминацию.

Таблица 18. Объединенные внутригрупповые матрицы

Стоимость ОПФ

Персонал

Прибыль

Корреляция

Стоимость ОПФ

1,000

, 552

, 570

Персонал

, 552

1,000

, 733

Прибыль

, 570

, 733

1,000

Данная таблица используется для анализа взаимосвязи между переменными. Так как коэффициент корреляции равен 0,57 то связь существует.

Таблица 19. Лямбда Уилкса

Проверка функции (й)

Лямбда Уилкса

Хи-квадрат

ст. св.

Знч.

1

, 069

14,745

3

, 002

По критерию проверяется значимость дискриминантной функции, поскольку функция значима на уровне 0,002, то имеет смысл использовать ее для дальнейшей классификации.

Таблица 20. Нормированные коэффициенты канонической дискриминантной функции

Функция

1

Стоимость ОПФ

629

Персонал

1,026

Прибыль

839

Стандартизированные коэффициенты позволяют непосредственно сравнить вклад каждой независимой переменной в различие 2-х групп.

Наибольший вклад вносит персонал, затем стоимость и прибыль.

Таблица 21. Структурная матрица

Функция

1

Персонал

758

Стоимость ОПФ

716

Прибыль

272

Объединенные внутригрупповые корреляции между дискриминантными переменными и нормированными каноническими дискриминантными функциями.

Переменные упорядочены по абсолютной величине корреляций внутри функции.

Главным фактором является персонал, затем ОПФ и прибыль, в подтверждении прошлой таблицы

Таблица 22. Поточечные статистики

Номер наблюдения

Фактическая группа

Наивероятнейшая группа

Вторая вероятнейшая группа

Дискриминантные баллы

Квадрат расстояния Махалонобиса до центра

Группа

P (G=g | D=d)

Квадрат расстояния Махалонобиса до центра

Функция 1

Предсказанная группа

P (D>d | G=g)

P (G=g | D=d)

Исходные

1

1

1

36

1

1,000

4,377

2

0

74,597

5,728

2

1

1

576

1

1,000

, 314

2

0

35,819

3,076

3

1

1

415

1

1,000

, 663

2

0

32,836

2,821

4

1

1

473

1

1,000

, 515

2

0

33,956

2,918

5

2

2

809

1

1,000

, 058

1

0

46,052

-3,150

6

2

2

357

1

1,000

, 850

1

0

31,619

-1,987

7

2

2

710

1

1,000

, 138

1

0

47,840

-3,281

8

2

2

986

1

1,000

, 000

1

0

43,070

-2,927

9

2

2

771

1

1,000

, 084

1

0

46,724

-3,199

10

несгруппированные

2

014

1

, 995

6,074

1

5

16,648

-, 444

11

несгруппированные

1

004

1

, 926

8,327

2

74

13,389

, 750

12

несгруппированные

1

863

1

1,000

, 030

2

0

40,599

3,463

В данной таблице мы видим процентную вероятность отношения к той или иной группе. Так из таблицы мы видим, что 10 номер с 99% в 2 группе, 11номер с 92% в 1групе и 12 номер с 100% в 1группе.

Таблица 23. Коэффициенты канонической дискриминантрой функции

Функция

1

Стоимость ОПФ

24

Персонал

549

Прибыль

197

(Константа)

4,507

D (x)=-4,507+0,024×1+0,549×2−0,197х3

Кредитный отдел коммерческого банка провел выборочное обследование заемщиков. Общий размер выборки составил 30 наблюдений. По каждому заемщику была собрана информация по следующим показаниям: х1-брал ли заемщик кредит в банке ранее,

х2 — среднемесячный доход семьи заемщика,

х3 — срок погашения кредита,

х4 — размер выданного кредита,

х5 — состав семьи заемщика,

х6 — возраст заемщика,

y — вероятность своевременного погашения выданного кредита (Н -низкая, С — средняя, В — высокая).

Таблица 24 — Результаты выборочного обследования заемщиков банка

Брался ли кредит ранее (1-да, 2-нет)

Среднемесячный доход семьи заемщика, тыс. руб.

Период погашения кредита, лет.

Размер кредита, тыс. руб.

Состав семьи заемщика, человек

Возраст заемщика, лет

Вероятность погашения кредита

1

1

25,20

5

180,0

3

43

С2

2

1

35,25

6

270,0

4

51

В3

3

1

31,50

7

150,0

6

42

В3

4

1

24,35

7

170,0

5

56

Н1

5

1

26,35

6

120,0

4

45

В3

6

1

37,50

8

370,0

5

48

В3

7

1

25,10

5

130,0

3

52

С2

8

1

28,50

2

180,0

6

51

С2

9

1

32,00

7

250,0

4

53

В3

10

1

34,05

7

160,0

5

45

С2

11

1

36,70

6

170,0

5

44

В3

12

1

35,90

5

200,0

4

41

В3

13

1

28,15

3

180,0

6

54

С2

14

1

24,65

4

120,0

3

56

В3

15

1

31,00

5

160,0

2

48

В3

16

2

16,05

5

140,0

3

58

Н1

17

2

18,10

3

130,0

2

55

Н1

18

2

21,65

2

150,0

2

37

С2

19

2

25,20

5

220,0

4

33

С2

20

2

22,05

6

360,0

3

42

С2

21

2

19,15

3

160,0

2

45

Н1

22

2

27,50

1

120,0

2

57

С2

23

2

23,05

3

150,0

3

51

Н1

24

2

17,58

10

400,0

5

44

Н1

25

2

18,65

2

90,0

4

54

Н1

26

2

20,90

5

310,0

3

36

С2

27

2

28,50

8

480,0

2

36

В3

28

2

16,70

6

280,0

2

26

Н1

29

2

18,35

3

220,0

3

28

Н1

30

2

20,65

3

250,0

2

42

Н1

Таблица 25 — Групповые статистики

Veroyatnost

Mean

Std. Deviation

Valid N (listwise)

Unweighted

Weighted

1,00

istoria

1,9000

, 31 623

10

10,000

doxod

19,2530

2,67 843

10

10,000

srok

4,5000

2,50 555

10

10,000

kredit

199,0000

91,22 012

10

10,000

semya

3,1000

1,19 722

10

10,000

vozrasn

45,9000

11,34 754

10

10,000

2,00

istoria

1,5000

, 52 705

10

10,000

doxod

25,6300

4,3 844

10

10,000

srok

4,1000

1,96 921

10

10,000

kredit

199,0000

77,95 298

10

10,000

semya

3,7000

1,49 443

10

10,000

vozrasn

45,0000

8,24 621

10

10,000

3,00

istoria

1,1000

, 31 623

10

10,000

doxod

31,9350

4,44 116

10

10,000

srok

6,2000

1,31 656

10

10,000

kredit

229,0000

117,42 137

10

10,000

semya

3,9000

1,28 668

10

10,000

vozrasn

46,4000

6,2 218

10

10,000

Total

istoria

1,5000

, 50 855

30

30,000

doxod

25,6060

6,41 398

30

30,000

srok

4,9333

2,13 240

30

30,000

kredit

209,0000

94,62 631

30

30,000

semya

3,5667

1,33 089

30

30,000

vozrasn

45,7667

8,52 454

30

30,000

В таблице групповые статистики приводятся средние значения, стандартные отклонения и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй. Результаты теста на значимости различий между переменных находящихся в разных группах приведены в таблице критерия равенства групповых средних. С помощью этих данных выявляется существенность различий. В данном примере весьма значимые различия между группами.

Таблица 26. Критерий равенства групповых средних

Wilks' Lambda

F

df1

df2

Sig.

istoria

, 573

10,047

2

27

, 001

doxod

, 326

27,918

2

27

, 000

srok

, 811

3,137

2

27

, 060

kredit

, 977

, 319

2

27

, 729

semya

, 933

, 977

2

27

, 389

vozrasn

, 995

, 065

2

27

, 937

Наиболее значимыми переменными являются история и доход. Если значение больше 0,005, то данную переменную можно выбраковать и она является не дискриминантной.

Таблица 27. Объединенные внутригрупповые матрицы

istoria

doxod

srok

kredit

semya

vozrasn

Correlation

istoria

1,000

-, 474

-, 103

, 426

-, 578

-, 426

doxod

-, 474

1,000

, 069

-, 065

, 503

, 203

srok

-, 103

, 069

1,000

, 616

, 321

-, 233

kredit

, 426

-, 065

, 616

1,000

-, 047

-, 465

semya

-, 578

, 503

, 321

-, 047

1,000

, 213

vozrasn

-, 426

, 203

-, 233

-, 465

, 213

1,000

Используются для анализа взаимосвязи между отдельными переменными. Существенная связь между сроком и кредитом, так как коэффициент равен 0,616. По критерию Лямбда Уилкса проверяется значимость дискриминантной функции. Он позволяет определить, значимо ли различаются между собой средние значения функции. Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

Таблица 28. Лямбда Уилкса

Test of Function (s)

Wilks' Lambda

Chi-square

Df

Sig.

1 through 2

, 208

38,460

12

0

2

, 830

4,561

5

472

Таблица 29. Нормированные коэффициенты канонической дискриминантной функции

Function

1

2

istoria

559

479

doxod

926

065

srok

172

1,415

kredit

172

745

semya

658

535

vozrasn

150

428

Самый значимый фактор для дискриминантной функции — это семья (вносит самый большой вклад = 0,658), а второй фактор — срок (вносит наибольший фактор = 1,415).

Таблица 30. Canonical Discriminant Function Coefficients

Function

1

2

istoria

1,401

1,199

doxod

-, 244

, 017

srok

-, 086

, 711

kredit

-, 002

-, 008

semya

, 494

-, 401

vozrasn

, 017

, 049

(Constant)

2,401

-4,926

Unstandardized coefficients

Данная таблица отражает уравнение дискриминантной функции. D1 (x) = 2,401 + 1,401×2 — 2,44×2 — 0,086×3 — 0,002×4 +0,494×5 + 0,017×6 D2 (x) = -4,926 + 1,199×2 — 0,017×2 — 0,711×3 — 0,008×4 -0,401×5 + 0,49х6

Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

6. Кластерный анализ

1. Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.

Таблица 31. Agglomeration Schedule (График, список скопления)

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage

Cluster 1

Cluster 2

Cluster 1

Cluster 2

1

9

12

43,430

0

0

10

2

1

4

62,260

0

0

3

3

1

16

87,850

2

0

8

4

5

13

88,850

0

0

6

5

8

11

89,440

0

0

16

6

5

6

132,115

4

0

11

7

3

15

139,910

0

0

9

8

1

14

156,987

3

0

11

9

3

7

168,525

7

0

12

10

9

17

266,345

1

0

13

11

1

5

298,305

8

6

12

12

1

3

386,649

11

9

14

13

9

10

460,167

10

0

15

14

1

2

523,984

12

0

15

15

1

9

1012,915

14

13

16

16

1

8

1265,510

15

5

0

Анализируя таблицу, мы видим скачкообразное изменение данных, начиная с 14 строки. Всего 17 строк. В нашем случае мы выделяем 3 кластера (17−14=3).

Рисунок 8

2. Теперь организуем для каждого наблюдения вывод информации о принадлежности кластеров.

Таблица 32. Cluster Membership (Кол-во в группе)

Case

3 Clusters

1: Белгород

1

2: Брянская

1

3: Владимир

1

4: Воронежс

1

5: Ивановск

1

6: Калужска

1

7: Костромс

1

8: Курская

2

9: Липецкая

3

10: Московск

3

11: Орловска

2

12: Рязанска

3

13: Смоленск

1

14: Тамбовск

1

15: Тверская

1

16: Тульская

1

17: Ярославс

3

Анализируя таблицу принадлежность кластеров, можно сделать вывод, что 11 областей относятся к первому кластеру, 2 области относятся ко второму кластеру, 4 области относятся к третьему кластеру.

Пока неясно, что означает полученные три кластера. Разобраться в этом помогут кластерные профили.

CLU31-принадлежность к тому или иному кластеру.

3. Проведем сравнение средних Report (Отчет)

Мы видим, что в первый кластер попали области, имеющие примерно одинаковый уровень цен по всем 5 секторам. Второй кластер отличается высоким индексом цен на реализованную с/х продукцию. Предприятия из 3 кластера характеризуются высоким индексом тарифа на грузовые перевозки.

Таблица 33

Average Linkage (Between Groups)

Область потребительских цен

Индекс цен производителей промышленной продукции

Индекс цен производителей на реализованную с.х. продукцию

Индекс цен производителей в строительстве

Индекс тарифов на грузовые перевозки

область

1

Mean

113,3909

117,5636

114,8364

115,2364

110,0000

N

11

11

11

11

11

11

Std. Deviation

1,76 434

6,871

8,22 658

3,50 550

6,98 570

2

Mean

114,2000

115,5000

146,0000

112,7000

115,0000

N

2

2

2

2

2

2

Std. Deviation

2,82 843

, 84 853

5,65 685

1,41 421

1,41 421

3

Mean

112,9750

118,6000

116,6250

110,7000

136,7000

N

4

4

4

4

4

4

Std. Deviation

1,49 081

7,59 737

8,46 891

3,88 244

4,3 898

Total

Mean

113,3882

117,5647

118,9235

113,8706

116,8706

N

17

17

17

17

17

17

Std. Deviation

1,72 840

5,85 096

12,73 551

3,82 079

12,84 040

7. Линейное программирование

Задание:

Х1 — затраты на посевной материалы

Х2 — затраты на обработку почвы

Х3 — затраты на применение минер. Удобрений

Х4 — затраты на применение гербицидов

Х5 — фактор сезонности

Х6 — предшественник

Линейное программирование — наука об исследованиях экстремальных значений линейной функции.

1) Нахождение целевых функций

Засушливый, вторая пшеница

Урожайность:

У=х1−0,003×2+0,001×3+0,001х4

Рентабельность:

У=-0,017×1−0,037×2−0,01×3−0,04х4

Засушливый, механический пар

Урожайность:

У=-00,1×1−0,007×2-х3+0,003х4

Рентабельность:

У=-0,019×1−0,066×2−0,013×3+0,006х4

Засушливый, первая пшеница

Урожайность:

У=х1−0,002×2+х3+0,001х4

Рентабельность:

У=-0,011×1−0,031×2−0,014×3−0,006х4

Засушливый, химический пар

Урожайность:

У=-0,001×1−0,002×2+0,001х3

Рентабельность:

У=-0,028×1−0,039×2−0,012х3

Обычный, вторая пшеница

Урожайность:

У=-0,02×1+0,006×2+0,001×3+0,004х4

Рентабельность:

У=-0,036×1+0,029×2−0,01×3+0,015х4

Обычный, первая пшеница

Урожайность:

У=х1+0,005×2+0,001×3+0,004х4

Рентабельность:

У=-0,019×1+0,014×2−0,014×3+0,011х4

Обычный, мех пар

Урожайность:

У=0,003×1+0,002×2+0,001×2+0,005х4

Рентабельность:

У=х1−0,006×2−0,006×3+0,020х4

Обычный, пар — химический

Урожайность:

У=-0,006×1+0,002×2+0,003х3

Рентабельность:

У=-0,062×1−0,012×2−0,003х3

Увлажненный, мех пар

Урожайность:

У=-0,005×1+х2+0,003×3+0,006х4

Рентабельность:

У=-0,043×1−0,016×2+0,002×3+0,022х4

Увлажненный, первая пшеница

Урожайность:

У=-0,004×1+х2+0,003×3+0,006х4

Рентабельность:

У=-0,055×1−0,022×2−0,003×3+0,021х4

Увлажненный, вторая пшеница

Урожайность:

У=-0,003×1+х2+0,003×3+0,005х4

Рентабельность:

У=-0,045×1−0,023×2−0,02×3+0,017х4

Увлажненный, хим. пар

Урожайность:

У=-0,010×1−0,006×2+0,003х3

Рентабельность:

У=-0,085×1−0,063×2+0,002х3

Засушливый период

Программа предполагает для того чтобы получить макс рентабельность, необходимо сократить затраты на максимально на фактор х1, однако существует определенная технология поэтому оставляем значения согласно технологоии-250 руб. Хотя для максимизации рентабельности, по идеи программа предполагает сократить полностью затраты. Распределение затрат происходит между факторами х2 и х3, и программа распределяет большинство ресурсов на фактор х2=1325 руб. Фактор х4 программа считает незначимым согласно технологии в засушливом периоде, поэтому мы можем отказать от обработки гербицидами.

Обычный период

Программа предлагает израсходовать 300 руб. на фактор х1 согласно технологии. Для максимизации рентабельности программа распределяет затраты между факторами х2, х3 и х4, и большинство ресурсов приходится на фактор х2=786 руб.

Увлажненный период

На фактор х2 программа считает наименее значимым согласно технологии в увлажненном периоде и мы можем сократить затраты на него до 450 руб. Самые значимые затраты на х3.

8. Параметрические и непараметрические критерии

1) Критерий Манна-Уитни

Таблица 34

пол

N

Mean Rank

Sum of Ranks

отметка2

ЖЕН

61

56,21

3429,00

МУЖ

39

41,56

1621,00

Total

100

Средний ранг для девушек равен 56,21, для юношей — 41,56. Это означает, что у девушек успеваемость выше, чем у юношей

Таблица 35. Test Statisticsa

отметка2

Mann-Whitney U

841,000

Wilcoxon W

1621,000

Z

-2,469

Asymp. Sig. (2-tailed)

, 014

a. Grouping Variable: пол

Две совокупности статистически достоверны, так как коэффициент равен 0,014, который не превышает коэффициент 0,05. Если бы он превышал наш коэффициент, то появились бы сомнения. Сравнение 2х связанных выборок а) Критерий знаков с помощью этого критерия сравним результаты учащихся по второму тесту и четвертому.

Таблица 36. Frequencies

N

осведомленность — числовые ряды

Negative Differencesa

39

Positive Differencesb

57

Tiesc

4

Total

100

a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды

Полученные результаты говорят о том, что в 39 случаях значение переменной тест 2 оказались меньшими, чем значения переменной тест 4, в 57 случаях значения переменной тест 2 превысили значения переменной тест 4 и 4 раза было установлено равенство.

Таблица 37. Test Statisticsa

осведомленность — числовые ряды

Z

-1,735

Asymp. Sig. (2-tailed)

, 083

a. Sign Test

Тест является недостоверным, так как значение больше коэффициента 0,05. Скорее всего, этот тест не подойдет для дальнейших исследований. б) Критерий Уилкоксона Недостатком критерия знаков является то, что он никак не учитывает величину разницы двух значений

Таблица 38. Ranks

N

Mean Rank

Sum of Ranks

осведомленность — числовые ряды

Negative Ranks

39a

42,26

1648,00

Positive Ranks

57b

52,77

3008,00

Ties

4c

Total

100

a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды

Таблица 39. Test Statisticsa

осведомленность — числовые ряды

Z

-2,493b

Asymp. Sig. (2-tailed)

, 013

a. Wilcoxon Signed Ranks Test

b. Based on negative ranks.

Тест является недостоверным, так как значение не превышает коэффициента 0,05. Скорее всего, этот тест Уилсона подходит для дальнейших исследований.

ПоказатьСвернуть
Заполнить форму текущей работой