Необходимое число наблюдений.
Выборочная совокупность.
Планирование экспериментов

Тип работы:
Контрольная
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

НАЦИОНАЛЬНЫЙ ГОРНЫЙ УНИВЕРСИТЕТ

ИЗДО

Контрольная работа

По дисциплине «Методология научных исследований»

Выполнил ст. гр.: м-ЕД-09

Томенко А.В.

Проверил: проф. Паленко В. И.

Днепропетровск 2010

Задачи

Задача № 1

Определение необходимого числа наблюдений

Постановка задачи

1. Предложите и опишите пример исследований путем проведения экспериментов, наблюдений или измерений с целью установления среднеарифметического значения любого технико-экономического показателя деятельности организации (предприятия, производственного подразделения, механизма и т. п.).

2. Выложите методику установления необходимого объема статистической выборки (количества наблюдений).

3. Обоснуйте исходные данные, необходимые для установления объема выборки.

4. Установите необходимое количество наблюдений технико-экономического показателя, исследуется.

5. Сформулируйте вывод относительно полученного объема статистической выборки.

Выполнение задания:

1. Для этого устанавливается необходимый объем статистической выборки.

2. Методика решения:

1) Рассчитывается вероятность появления случайного отклонения по отношению:

е =,

где Д x — допустимая величина случайного отклонения выборки;

S — среднеквадратическое отклонение выборки.

2) Принимается коэффициент надежности эксперимента (б) исходя из условий задачи и назначение экспериментальных данных. Как правило, для задач экономического характера б принимается равным 0,9.

3) В табл.1 находится, согласно со значениями е и б, число минимально необходимых наблюдений исследуемого признака.

4) Формулируется вывод относительно полученного объема статистической выборки.

3. Принимаем среднеквадратичное отклонение данных выборки, равным 7,5%. Случайное отклонение представленных значений, согласно целью исследования, равна 1,5%. Коэффициент надежности эксперимента (б) принято равным 0,9. Коэффициент вероятности появления случайного отклонения Е = 1,5/7,5 = 0,2.

4. Определяем необходимое количество наблюдений за расходами на маркетинговые исследования по следующим данным: E = 0,2, б = 0,95.

По табл.1 число необходимых наблюдений равна 70.

5. Вывод: Таким образом, выборочная совокупность должна иметь не менее 70 наблюдений. Этот объем данных позволит рассчитать такую среднеквадратичную величину, относительно которой в интервале допустимого случайного отклонения ± 1,5% любой результат наблюдения будет попадать с вероятностью б = 0, 95.

Таблица 1

Необходимое число измерений для получения случайной погрешности е с надежностью б

е =

б

0,5

0,7

0,9

0,95

0,99

0,999

1,0

2

3

5

7

11

17

0,5

3

6

13

18

31

50

0,4

4

8

19

27

46

74

0,3

6

13

32

46

78

127

0,2

13

29

70

99

171

277

0,1

47

169

273

387

668

1089

0,05

183

431

1084

1540

2659

4338

0,02

4543

10 732

27 161

38 416

66 358

108 307

Задание № 2

Проверка на нормальность распределения выборочной совокупности.

1. Предложите и опишите пример исследований путем проведения экспериментов, наблюдений или измерений.

2. Составьте статистическую выборку для проверки на нормальность распределения любого технико-экономического показателя деятельности организации (предприятия, производственного подразделения, механизма и т. п.). Объем статистической выборки — не менее 40 наблюдений (измерений).

3. Выложите методику проверки статистической выборки на распределение по нормальному закону.

4. Выполните проверку составленной выборки по поз.2 на нормальность распределения.

5. Сформулируйте вывод относительно полученного результата проверки.

Выполнение задания:

1. Исследуется спрос одежды в сети супермаркетов, имеет достаточный объем наблюдений, но распределение случайной величины является неизвестным. Необходимо проверить выборку на нормальность распределения.

2. Упорядочим размещения данных в возрастающем порядке с помощью программы Мастер функций (п. 2).

3. Методика состоит из следующих этапов:

а) выборку разбивают на равные интервалы, величина которых определяется выражением:

h =, (2. 1)

где Х - Максимальное значение выборки;

Х — Минимальное значение выборки;

n - число наблюдений.

Нижней границей начального интервала будет минимальное значение выборки, верхней — минимальное, увеличенное на величину (шаг) интервала. Последнее, в свою очередь, будет нижней границей следующего интервала, а верхняя — определяться шагом интервала. Последний интервал должен содержать максимальное значение выборочной совокупности данных.

б) по каждому интервалом находят его среднее значение как сумму верхней и нижней границ соответствующего интервала, разделенную пополам. Выделив поле, равная числу интервалов, и воспользовавшись командой Вставка / Функция / Статистические / Частота встроенных функций Excel находят частоту появления значений каждого интервала m, указав в диалоговом окне, '' Аргументы функции'' в поле, Массив данных'' массив данных выборки, а в поле, Массив интервалов'' - верхние границы интервалов совокупности данных. Для выполнения команды одновременно нажимают клавиши < Ctrl> + < Shift> + < Enter>.

в) рассчитывают среднее значение всей совокупности данных x и ее среднеквадратичное отклонение д с помощью команд, соответственно, Вставка / Функция / Статистические / СРЗНАЧ и Вставка / Функция / Статистические / СТАНДОТКЛП, где в поле диалоговых окон программы отмечают весь диапазон данных выборки;

г) для каждого интервала значений определяют теоретическую (выравнивающую) частоту с выражением:

m =, (2. 2)

где ц (t) — Табличное значение функции ц (x) = вероятности появления теоретического значения выборки (среднего значения i — го интервала).

Параметр t как количественное выражение вероятности появления среднего значения xвыделенного i — го интервала определяют по формуле:

t =. (2. 3)

д) устанавливают относительные эмпирические частности по выражению:

m, =, (2. 4)

где m ? — Эмпирическая частота i — го интервала;

nв — Число наблюдений;

е) определим относительные теоретические частости по выражению:

m,=, (2. 5)

где mТ i — Теоретическая частота i — го интервала;

— Сумма теоретических частот;

ж) рассчитывают накопленные эмпирические F (mвi ?) и теоретические F (mTi ?) частости как сумму соответствующей относительной частости i-го интервала и относительных частостей предыдущих интервалов;

с) определяют разницу между накопленными эмпирическими и теоретическими частости за каждым интервалом и устанавливают среди них максимальное отклонение D max;

и) устанавливают фактический критерий отклонения эмпирического распределения от теоретического по следующей формуле:

л= D. (2. 6)

к) определяют предельное значение отклонения лk эмпирической функции от теоретической за накопленными частости согласно критерию Колмогорова по табл.2. 1, исходя из уровня значимости результатов расчетов k.

Таблица 2. 1

Предельный критерий отклонения эмпирического распределения от теоретического

k

10

5

2

1

0,5

0,1

л

1,224

1,358

1,517

1,627

1,731

1,950

л) сравнивают значения л з л. Если л? л, то делают вывод, что эмпирический распределение данных не противоречит нормальному распределению.

4. Осуществляется проверка выборки на нормальность распределения:

а) разобьем выборку на интервалы, определив их шаг по формуле (2. 1):

h = 15,3.

Результат расчетов представим в табл.2. 3, гр.1 и на рис. 2.1.

Таблица 2. 2

Исходные данные проверки на нормальность распределения

День исследования

Спрос одежды

День исследования

Спрос одежды

День исследования

Спрос одежды

День исследования

Спрос одежды

1

306

11

336

21

357

31

377

2

308

12

338

22

358

32

381

3

311

13

339

23

360

33

381

4

313

14

343

24

361

34

382

5

317

15

344

25

362

35

392

6

320

16

344

26

366

36

392

7

323

17

346

27

372

37

396

8

325

18

354

28

374

38

399

9

326

19

355

29

374

39

399

10

326

20

355

30

375

40

400

б) находим среднюю долю маркетинговых исследований xi и частоту появления значений каждого интервала mві согласно изложенной выше методике. Результаты расчетов представим в табл.2. 3, гр.2 и 3.

Таблица 2. 3

Расчет накопленных частот

Интервал

Среднее значение

x

Частота

Относительная частость

Относительная накопительная частость

Раз ница

m

m

m?

m?

F (m?)

F (m?)

(гр.7 — гр. 8)

1

2

3

4

5

6

7

8

9

306−321,3

321,4−336,7

336,8−352,1

352,2−367,5

367,6−382,9

383−400

313,7

329,1

344,5

359,9

375,3

392

6

5

6

9

8

6

7,15

4,46

5,64

8,13

9,12

5,08

0,150

0,125

0,150

0,225

0, 200

0,150

0,18

0,11

0,14

0,21

0,23

0,13

0,150

0,275

0,425

0,650

0,850

1,000

0,18

0,29

0,44

0,64

0,87

1,00

-0,03

-0,02

-0,01

0,01

-0,02

0,00

У

40

39,58

1

1

в) находим среднее значение выборочной совокупности и среднеквадратичное отклонение выборки д с помощью программы Мастер функций: =354,7, д= 28;

г) для каждого интервала долей маркетинговых исследований устанавливаем теоретические частоты по формуле (2. 2), (табл.2. 3, гр. 4) с предварительно определенным параметром t і по формуле (2. 3);

д) определим относительные эмпирические частности mві ? за формулою (2. 4) (табл.2. 3, гр. 5):

е) определим относительные теоретические частности mТі ? 'По формуле 2.5 (табл.2. 3, гр. 6);

ж) рассчитаем, соответственно, накопленные относительные эмпирические F (mві ?) И теоретические частости F (mТі ?) (Табл.2. 3, гр 7 — 8) согласно пункту ж методики;

с) определим разницу накопленных эмпирических и теоретических частостей частиц маркетинговых исследований по каждому интервалом и установим их максимальное отклонение D (табл.2. 3, гр. 9): D= 0,03;

и) установим фактический критерий отклонения эмпирического распределения от теоретического по Колмогоровым по формуле (2. 6): л=0, 19;

к) по табл.2.1 определяем предельный критерий Колмогорова соответствии эмпирических данных нормальному распределению. По уровню значимости 5%, что соответствует условию задачи, лk = 1,358;

л) сравниваем расчетное и табличное значение критерия Колмогорова: л= 0,19 < л= 1,358.

5. Вывод: поскольку расчетное значение критерия соответствия эмпирического распределения 0,19 меньше теоретического критерия Колмогорова 1,358, то можно утверждать, что совокупность частиц маркетинговых данных, которая исследуется, подчиняется нормальному закону распределения, а результаты обследований (указанные доли) являются случайными величинами и управления ними требует специальных средств.

Задание № 3

Планирования экспериментов

Постановка задачи

1. Предложите и опишите пример исследований путем проведения экспериментов, наблюдений или измерений.

2. Разработайте рандомизированный план проведения исследований для установления корреляционной зависимости любого технико-экономического показателя деятельности организации (предприятия, производственного подразделения, механизма и т. п.) от одного из управляемых факторных переменных, влияющих на этот показатель. Исключите при этом влияние таких внешних независимых переменных. План должен быть составлен в виде двух квадратов 4×4.

3. Опишите, каким образом следует проводить наблюдения по Вашему плану эксперимента.

4. Напишите результаты наблюдений и рассчитайте средне стать-сточные данные для определения указанной выше зависимости.

Выполнение задания

1. Нужно установить зависимость y= f (x), где yі — Объем перевозок руды от карьера до обогатительной фабрики, а xі — Расстояние транспортировки, что позволит определить норму выработки водителя автомобиля для разного расстояния перевозок. Измеряется объем перевозок y при различных расстояниях (внутренняя регулируемая переменная x= 2,2; 2,8; 3,3; 4,0; 4,9; 5,4; 6,0 і 7,5 км) где как независимые внешние переменные приняты день недели (ПН, ВТ, СР, ЧТ), водитель (А, B, C, D) и автомобиль (Z, Y, X, W).

2. Каждый регулируемая переменная сочетается в рандомизированном плане с другими независимыми факторами так, чтобы в совокупности их значений не было повторений любого фактора как по горизонтали, так и по вертикали (табл.3.1 Таким образом каждый водитель ежедневно работает на разном расстоянии перевозок и на другом автомобиле и каждый день эти условия не повторяются для других водителей.

Таблица 3. 1

Рандомизированный план проведения наблюдений по объемам перевозок руды

Блок 1

водители

День недели

ПН

ВТ

СР

ЧТ

A

2,2W

2,8Y

4W

3,4Z

B

3,4W

4Z

2,8X

2,2Y

C

4Y

2,2X

3,4X

2,8W

D

2,8Z

3,4Z

2,2Y

4X

Блок 2

водители

День недели

ПН

ВТ

СР

ЧТ

A

4,9X

5,4Y

6W

7,5X

B

7,5Y

4,9Z

5,4X

6Y

C

6Z

7,5W

4,9Y

5,4Z

D

5,4W

6X

7,5Z

4,9W

Усреднения полученных значений такого плана по регулируемому фактором (расстояние перевозки) позволяет провести полную рандомизацию эксперимента по всем нерегулируемым переменными (день недели, водитель, автомобиль), тем самым минимизируется случайное влияние последних на исследуемую признак.

3. Следовательно, проведя наблюдения, согласно составленному плану для каждой расстояния перевозок получим четыре значения объема перевозок (табл.3. 2), на основании которых, соответственно, выводится их среднее значение.

Таблица 3. 2

Объемы перевозок руды

Расстояние перевозки

x, км

Объём перевозки

y, т/ смену

Норма выработки

yзм, т/смену

2,2

26

27,5

26

24,5

26,00

2,8

23,7

25,3

22,3

22,3

23,40

3,4

21,6

22,8

21,2

20,8

21,60

4

19,8

20,6

20,1

19,4

20,00

4,9

18,1

19,9

19

18

18,75

5,4

16,6

18,1

18,1

16,8

17,40

6

15,2

16,4

17,2

15,7

16,00

7,5

14

14,9

16,3

14,7

15,00

4. Полученные нормы выработки является результатом сбалансирования условий эксперимента и могут быть использованы для управления случайными параметрами процесса транспортировки через их соответствие закономерности распределения случайных величин.

Задание № 4

Регрессионная модель. Коэффициенты детерминации и корреляции

С использованием среднестатистических данных, полученных в ходе решения задачи 3, установите корреляционная зависимость любого технико-экономического показателя деятельности организации (предприятия, производственного подразделения, механизма и т. п.) от одного из управляемых факторных переменных (признаков), которые влияют на этот показатель С этой целью выполните следующее:

1) постройте графическую зависимость;

2) выберите форму уравнения связи для описания указанной зависимости;

3) установит коэффициенты уравнения корреляции и напишите это уравнение;

4) оцените тесноту связи между признаками, коррелирующие, для чего рассчитайте коэффициент корреляции, его погрешность и надежность;

5) сформулируйте вывод о возможности использования полученного уравнения корреляции для прогнозирования показателя, который рассматривается в этой задаче.

Выполнение задания

В результате проведения исследования были получены результаты наблюдений по объему перевозок руды автомобилями на разное расстояние (табл.4. 1). Необходимо установить зависимость между объемом выработки автомобиля (y) и расстоянием перевозок (x) и проверить полученную зависимость показателей на адекватность.

1. Строится графическая зависимость по результатам наблюдений в виде графика функции y = f (x), проходящей через точки пересечения всех имеющихся данных исследуемых признаков (рис. 4. 1).

Таблица 4. 1

Объемы перевозок на разное расстояние

Расстояние перевозок, x, км

Норма выработка yзм, т/смену

2,2

26

2,8

23,4

3,4

21,6

4

20

4,9

18,75

5,4

17,4

6

16

7,5

15

/

Рис 4.1 Зависимость объема выработки от расстояния перевозки

2. Исходя из рис. 4.1 очевидно, что между показателями существует линейная зависимость типа y = a + bx: постепенное увеличение расстояния перевозки обусловливает соответствующее уменьшение объема выработки.

3. Определяются коэффициенты регрессии а и b по формулам (4. 1) и (4. 2). Получено: b = - 1,5, a = 26,6. Итак, уравнение регрессии имеет следующий вид: y = - 1,5 x + 26,6.

4. Рассчитывается коэффициент корреляции признаков, которые исследуются, по формуле (4. 3). Для установленного уравнения регрессии r = 0,98, что свидетельствует об очень тесной связи между факторным и результативным показателями.

Устанавливается погрешность коэффициента корреляции и его надежность за выражениями соответствии (4. 4) и (4. 5). Эти характеристики равны: S = 0,08, М = 12,25

5. Полученный коэффициент корреляции, а также его погрешность и надежность свидетельствуют об устойчивой связь между коррелированными признаками, что делает модель парной корреляции пригодной для использования в практических расчетах нормы выработки.

Постановка задачи № 5

Выявления грубых ошибок

1. Введите в совокупность среднестатистических данных, полученных в результате выполнения задания 4, один результат наблюдений, по величине очень отличается от общей закономерности изменения данных, которую отражает совокупность.

2. С учетом этого результата (грубой ошибки или промаха) установите корреляционная зависимость технико-экономического показателя от факторной переменной в порядке, определенном в задании 4:

а) постройте графическую зависимость;

б) выберите форму уравнения связи для описания указанной зависимости;

в) установите коэффициенты уравнения корреляции и напишите это уравнение;

г) оцените тесноту связи между признаками, корригирующие, для чего рассчитайте коэффициент корреляции, его погрешность и надежность;

выборочная совокупность корреляция детерминация

3. Оцените, насколько изменились показатели тесноты связи между признаками, которые исследуются при наличии в статистической зависимости грубых ошибок, для чего полученные показатели сравните с соответствующими показателями в задании 4;

4. Изложите методику выявления грубых ошибок;

5. Выполните проверку возможности изъятия результата наблюдений, который очень отличается от общей закономерности изменения данных, из статистической совокупности данных.

6. Сформулируйте вывод относительно полученного результата проверки.

Выполнение задания

1. Подставим вместо одного показателя статистической совокупности, полученной в задании 3, другой показатель, с целью его проверки на соответствие закономерности распределения данных, а именно, вместо значения объема выработки 16 т / смену (табл.4. 1), которая соответствует расстоянию транспортировки 6 км, объем выработки, равный 25 т / смену (табл.5. 2).

Таблица 5. 2

Объемы перевозок на разное расстояние

Расстояние перевозок, x, км

Норма выработка yзм, т/смену

2,2

26

2,8

23,4

3,4

21,6

4

20

4,9

18,75

5,4

17,4

6

25

7,5

15

2−3. Устанавливаем корреляционной зависимости между признаками, которые исследуются, и сравниваем ее показатели с аналогичными показателями, полученными в задании 4:

а) построим график функции зависимости исследуемых признаков:

Исходя из рис. 5.1 видно, что значение 25 т / смену, проверяемого нарушает общую тенденцию изменения функции. Следовательно, его надо проверить на подлинность;

б) предполагается, что построен график функции, описывает линейную зависимость типа у = а + bx;

в) определяются коэффициенты регрессии а и b по формулам (4. 1) и (4. 2), приведенным в п. 3 задания 4: b = - 1, a = 25,3. Итак, уравнение регрессии имеет следующий вид: y = - x + 25,3. В то же время, уравнение регрессии к замене одного результата наблюдений имело вид: y = x + 25,3. Следовательно, этот показатель повлек существенное нарушение связи исследуемых признаков;

/

Рис 5.1 Зависимость объема выработки от расстояния перевозки

г) рассчитывается коэффициент корреляции признаков, которые исследуются по формуле (4. 3): r = 0,4, что свидетельствует об ослаблении связи между факторным и результативным показателями против r = 0,98 при предыдущем расчете.

Устанавливается погрешность коэффициента корреляции Sr = 0,4 и его надежность М = 1, соответственно, по формулам (4. 4) и (4. 5). Когда погрешность коэффициента корреляции против S r = 0,08 выросла, а надежность против М = 12,25 — уменьшилась, что указывает на необходимость проверки указанного результата наблюдений, на его адекватность установленной ранее закономерности распределения данных.

4. Описывается, каким образом необходимо проверить статистическую совокупность на наличие грубой ошибки.

5. Осуществляется проверка статистической совокупности на наличие ложного значения, согласно методике:

а) рассчитывается критическое значение критерия Шовен для существующей совокупности усредненных данных:

Pш =1/ (2•8) = 0,0625.

б) определяется вероятное отклонение совокупности данных по формуле (5. 2): н = 2,75.

в) рассчитывается показатель точности данных выборки по формуле (5. 3): з = 0,17.

г) устанавливается по формуле (5. 4) величина отклонения показателя, проверяемого от среднего значения статистической совокупности: yв = 9,5;

д) устанавливается по табл.5.1 вероятность P зy попадания отклонения в интервал от + 0,17 • 9,5 до — 0,17 • 9,5: Pзy = 0,966;

е) определяется вероятность непопадания P yв отклонения в заданный интервал по формуле (5. 5):

Py = 1 — 0,952 = 0,034.

6. Вывод: так как вероятность непопадания заданного отклонения признаки 0,048 меньше критического значения Шовен, которое для данной совокупности объемов перевозки равна 0,0625, то показатель объема перевозки 25,0 т / смену должен быть исключен из статистической выборки.

Используемая литература

1. Шейко В. Н., Кушнаренко Н. Н. Организация и методика научно-исследовательской деятельности: Учебник. — М.: Знание-Пресс, 2003. — 295 c.

2. Бородич С. А. Вводный курс эконометрики: Учебное пособие? Мн.: БГУ, 2000.? 354 с.

3. Конспект лекций

ПоказатьСвернуть
Заполнить форму текущей работой