Методы представления статистических данных

Тип работы:
Контрольная
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Методы представления статистических данных

Содержание

  • 1. Методы представления данных статистики
  • Табличный метод представления данных правовой статистики
  • Абсолютные и обобщающие (относительные и другие) показатели
  • Относительные величины, их виды и применение в правовой статистике
  • Среднее геометрическое
  • Мода и медиана
  • Метод выборочного наблюдения
  • Определение пестроты выборки
  • Определение необходимого объема выборки
  • 2. Статистические ряды
  • Понятие и классификация рядов динамики
  • Литература

1. Методы представления данных статистики

Табличный метод представления данных правовой статистики

Результаты сводки и группировки материалов статистического наблюдения, как правило, представляются в виде статистических таблиц — систематизированного, рационального изложения статистических показателей, наглядно иллюстрирующих все наиболее важные стороны изучаемых явлений по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Табличный метод зародился в XVIII в. в Европе (в Дании). Так называемые табличные статистики выражали важнейшие моменты жизни различных государств в числах и таблицах в отличие от словесного описания.

По логическому содержанию таблица представляет собой «статистическое предложение», главные элементы которого — подлежащее и сказуемое.

Статистическое подлежащее - это те объекты или составные части, которые характеризуются в таблице.

Статистическое сказуемое - это совокупность показателей, которыми характеризуется объект изучения.

Чрезмерное загромождение таблиц цифровым материалом затрудняет ее чтение и анализ. Смысл описательной статистики, по образному выражению академика Н. М. Крылова, не в том, чтобы заполнять таблицы цифр размерами с двуспальную простыню. Эти цифры могут занимать и четверть тетрадного листа, но должны отражать исчерпывающую суть явления: чтобы видно было, как это явление выглядело раньше, каково оно в настоящий момент, каковы перспективы его развития, его будущее.

Графическое представление статистических данных (гистограмма, полигон, кривая концентрации)

Наглядное представление облегчает восприятие информации.

Кривая концентрации (Лоренца) показывает неравномерность распределения показателя между единицами отдельных групп вариационного ряда.

Абсолютные и обобщающие (относительные и другие) показатели

В зависимости от метода исчисления показатели делятся на абсолютные и обобщающие.

Абсолютный показатель — величина, получение которой не связано с другими показателями; она непосредственно характеризует изолированное отдельное свойство объекта. Абсолютная величина всегда связанна с единицей измерения (преступлений, потерпевших, уголовных дел, суммы ущерба и т. д.).

Обобщающий показатель — величина, характеризующая свойство объекта в сравнении с другими свойствами или свойствами других объектов.

Перед нами два абсолютных показателя, отражающих регистрацию преступлений за 1996 г. в Санкт-Петербурге (84 097) и в Москве (87 167). Спрашивается, в каком городе выше преступность и можно ли на основании имеющихся абсолютных показателей сделать вывод о том, что преступность в Москве распространена значительно больше, чем в Санкт-Петербурге? Конечно нет, так как эти города значительно отличаются друг от друга по численности населения.

Обобщающие показатели делятся на относительные и средние величины.

метод динамика ряд выборочный

Относительные величины, их виды и применение в правовой статистике

Величины, полученные путем сопоставления двух показателей, в статистике называют относительными величинами. Относительная величина получается как частное от деления одной величины на другую. Исчисление относительных величин предпринимается в различных целях: для выяснения структуры изучаемого явления, для сравнительной оценки его состояния, происходящих в нем изменений, степени его развития.

Относительные величины, наиболее часто применяемые в аналитической работе правоохранительных органов, можно разделить на следующие группы:

1) относительные величины, характеризующие долю (отношение части к целому);

2) относительные величины, характеризующие темпы изменения каких-либо явлений во времени;

3) относительные величины степени, выражающие отношение разнородных величин, не связанных между собой как часть и целое (например, сравнение фактического и планового выпуска продукции, числа жителей и площадь в квадратных километрах), а также отношение одной части совокупности к другой (например, отношение числа осужденных мужчин к числу осужденных женщин).

Относительные величины чаще выражаются отвлеченными числами (когда размерность числителя и знаменателя совпадают), но могут и иметь производную размерность (например, «жителей на кв. км»). Относительные показатели встречаются достаточно часто (расход топлива л/км, цена руб. /шт., руб. /кг.,. расход краски г/м2, скорость заполнения л/мин., плотность и т. д.). Среднее арифметическое простое и взвешенное

Предположим, нужно вычислить средний возраст лиц, совершивших хулиганство. Суммируются возрастные показатели каждого лица и сумма делится на число единиц совокупности. Среднее арифметическое простое исчисляется как сумма отдельных значений показателя, деленная на их число п:

Однако, если имеется для решения указанной задачи сводка вида:

Возраст, x

Количество, f

где x - варианты а f — веса (частоты), можно использовать формулу среднего арифметического взвешенного:

Формула справедлива для решения таких задач, где подсчитывается среднее относительной величины:

Скорость, v

Время движения, t

Урожайность, ц/га

Площадь, S

60

2

20

100

80

3

35

50

1) Найти среднюю скорость движения, если известно, что автомобиль двигался 2 часа со скоростью 60 км/час и 3 часа — со скоростью 80 км/час. v = S / t = (602 + 803) / (3+2) = 75 (общий путь, деленный на общее время);

2) Найти среднюю урожайность, если урожайность полей площадью 100 га составила 20 ц/га, а полей 50 га — 35 ц/га. x = (20 100 + 3550) / (100+50) = 25 (общий урожай, деленный на общую площадь).

Среднее гармоническое

Рассмотрим похожие задачи:

Скорость, v

Расстояние, S

Урожайность, ц/га

Собрано, т

60

300

25

100

80

400

14

80

1) Найти среднюю скорость движения, если известно, что автомобиль проехал 300 километров со скоростью 60 км/час и 400 километров — со скоростью 80 км/час. v = (300+400) / (300/60 + 400/80) = 70 (общий путь, деленный на общее время);

2) Найти среднюю урожайность, если при урожайности 20 ц/га собрано 100 ц, а при урожайности 40 ц/га — 80 ц. x = (100 + 80) / (100/25 + 80/14) = 20 (то есть общий урожай, деленный на общую площадь).

В общем случае полученная средняя величина называется средней гармонической и вычисляется по формуле:

Для частного случая, когда все веса fi равны единице, формула упрощается:.

Среднее гармоническое часто применяется для анализа хозяйственной деятельности.

Среднее геометрическое

Предположим, годовые темпы роста преступности составили в 1997 г. — 1,02; в 1998 г. — 1,04; в 1999 г. — 1,04 и в 2000 г. — 1,03. Тогда среднегодовой темп за четырехлетие будет равен:

Среднее геометрическое исчисляется извлечением корня степени п из произведений п отдельных значений признака:

Иногда на практике вычисление средней геометрической производится с помощью логарифмов.

Мода и медиана

Для характеристик распределения, альтернативных средним значениям, используются следующие показатели:

Мода (Mo) — вариант с наибольшей частотой. К моде прибегают для выявления величины признака, имеющей наибольшее распространение (цена на рынке, по которой было совершено наибольшее число продаж данного товара, номер обуви, который пользуется наибольшим спросом у покупателей, и т. д.). Геометрически определяется по полигону и гистограмме следующим образом:

Медиана (Me) — это значение, которое делит негруппированный вариационный ряд на две равные по объему части. Например, курсы валюты в обменных пунктах составили 1,8; 1,3; 1,2; 1,4; 1,2; 1,9; 1,4. Вычисление среднего невозможно из-за неизвестных объемов продаж. Вариационный ряд: 1,2; 1,2; 1,3; 1,4; 1,4; 1,8; 1,9. Медиана для данного случая составила 1,4. В том случае, если ряд состоит из четного числа значений, медиана находится как среднее арифметическое двух центральных значений. Например, для вариационного ряда 1, 1, 3, 7, 9, 12 медиана будет найдена как Me = (3+7) /2 = 5.

Размах вариации, среднее линейное и среднеквадратическое отклонения, коэффициент вариации

Указанные показатели называют показателями вариации.

Размах вариации или амплитуда вариации - разность между максимальным и минимальным значением вариантов. Средние характеристики недостаточно исчерпывающе описывают статистические данные. Например, среднее арифметическое будет равно нулю для двух следующих рядов: — 30, — 5, 5, +30 и — 5, 0, 1, 2,2. Характеристика размаха вариации (для первого случая — 60, для второго — 7) уточнит особенности рядов.

Для обнаружения различий рядов такого типа: — 30, — 30, — 30, — 5, 5, +30, +30, +30 и — 30, — 5, — 5, — 5, 5, 5, 5, +30 (а у них при одинаковом размахе = 60 и среднем = 0 разные средние показатели отклонения от центра) используются следующие характеристики:

Среднее линейное отклонение вычисляется:

или, для сведенных данных

Для группированного интервального ряда в качестве xi выбираются середины интервалов.

Среднеквадратическое отклонение (в англоязычной литературе «the standard deviation», сокращенно — «s. d. « или просто «s»; в русскоязычной — СКО) вычисляется:

, для сведенных данных

Квадрат среднеквадратического отклонения дает величину дисперсии, на которой основаны практически все методы математической статистики.

Наконец, важным производным относительным показателем вариации, учитывающим для среднеквадратического отклонения порядок самих величин является коэффициент вариации:. Действительно, среднее отклонение 50 будет иметь при среднем значении 100 и 100 000 разные смыслы.

Метод выборочного наблюдения

Генеральная совокупность - совокупность единиц, из которой производится отбор некоторой ее части для статистического исследования.

Выборочная совокупность - совокупность единиц, которая отобрана из генеральной совокупности и подвергнута наблюдению (регистрации интересующих нас признаков). i

Существует ошибка в определении показателей (средних или долей) выборочной совокупности именно потому, что последняя является только частью генеральной совокупности. |

Эти так называемые ошибки репрезентативности представляют собой расхождение между показателями выборочной и генеральной совокупности.

Обстоятельства, обусловливающие величину ошибки репрезентативности:

1) способ формирования выборочной совокупности;

2) степень пестроты изучаемого признака в генеральной совокупности;

3) объем выборки.

Для каждого конкретного выборочного наблюдения величина ошибки репрезентативности может быть определена.

Пестрота и определение ошибки выборки. Определение необходимого объема выборки

Определение пестроты выборки

Для количественного признака в качестве оценки пестроты выборки используется дисперсия 2.

Для атрибутивного признака (может присутствовать или нет; например, наличие судимости) полагают в качестве значений 0 и 1, тогда дисперсия 2=p (1-p), где p — доля признака в выборке.

Например, для выборки людей, у трети которых была судимость, пестрота будет составлять:

2= 1/3 2/3 = 2/9.

Средняя ошибка репрезентативности определяется:

Когда требуется повышенная точность результатов исследования, допускается W < 0,03, обычная точность допускает W < 0,1; приближенная — W < 0,2; ориентировочная — W < 0,4.

Определение необходимого объема выборки

Важным вопросом проведения выборочного наблюдения является расчет необходимой численности выборки. Очевидно, излишняя численность выборки не экономична, а ее недостаточность приведет к недопустимо большой ошибке репрезентативности. Минимальная численность может быть получена при известной допустимой ошибке репрезентативности:

2. Статистические ряды

Понятие и классификация рядов динамики

Одно из основных положений научной методологии — изучение всех явлений в развитии. Оно имеет самое непосредственное отношение и к статистике. С учетом того, что основным приемом статистического анализа является сравнение исследуемых совокупностей, становится очевидным роль и значение рядов динамики в статистике.

Ряд в статистике - это цифровые данные, показывающие изменение явления во времени или в пространстве и дающие возможность производить статистическое сравнение явлений как в процессе их развития во времени, так и по различным формам и видам процессов. Благодаря этому можно обнаружить взаимную зависимость явлений.

Как изменяется год за годом преступность в стране? Каковы тенденции этих изменений? Как возрастает или снижается уровень нагрузки следователей, судей? Велики ли колебания уровня преступности, ее сезонные изменения? На все аналогичные вопросы ответ может дать только специальная система статистических методов, предназначенная для изучения развития, изменения во времени, изучения динамики.

Процесс развития, движения явлений во времени в статистике принято называть динамикой. Для отображения динамики строят ряды динамики (хронологические, временные), которые представляют собой ряды изменяющихся во времени значений статистического показателя (например, число осужденных за определенный период).

Статистическая и корреляционная связь. Коэффициент корреляции

В процессе статистического исследования объективно существующих связей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Признаки, обусловливающие изменение других, связанных с ними признаков, называются факторами, признаки, изменяющиеся под действием факторных признаков, — результативными.

Различают два вида (типа) связей между различными явлениями и их признаками: функциональную, с одной стороны, и статистическую - с другой.

Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины: каждому значению признака фактора соответствуют вполне определенные значения результативного признака. Так, изменение температуры внешней среды (фактор) адекватно отражается на шкале ртутного столбика (результативный признак) градусника. Между длиной радиуса и площадью круга также существует функциональная связь, выражаемая тем, что любой величине радиуса будет соответствовать строго определенная величина окружности. Обычно функциональные связи свойственны явлениям, изучаемым такими науками, как физика, механика, химия и т. д., где в условиях искусственного эксперимента возможно элиминировать (устранить) влияние всех не интересующих ученого факторов и в «чистом» виде исследовать взаимосвязь изучаемых признаков.

Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит только от первой и ни от чего более. Понятно, что в общественных явлениях мы почти не встречаемся с такими связями, так как наряду с влиянием интересующего нас фактора имеется влияние многих других факторов, что исключает возможность установления строго математической связи между данным фактором и каким-либо зависящим от него явлением; это лишь абстракции, полезные и необходимые при анализе явлений, но упрощающие реальность.

Социально-правовые процессы — это результат одновременного воздействия большого числа причин. Поэтому при их изучении необходимо выявлять главные, основные, сущностные, абстрагируясь от второстепенных, побочных.

Напротив, стохастическиесвязи не имеют ограничений и условий. При статистической связи разным значениям одной переменной соответствуют разные распределения значений другой переменной.

Важнейший частный случай статистической связи — корреляционная связь. Корреляционная зависимость - взаимосвязь между признаками, состоящая в том, что средняя величина значений одного признака меняется в зависимости от изменения другого признака (например, зависимость между выработкой рабочих и стажем работы, между аварийностью и профессионализмом водителей автотранспорта, между числом судимостей преступника и временем его нахождения на свободе между ними и др.). С увеличением стажа средняя выработка изменяется (в общем, тоже возрастая), с повышением профессионализма, с увеличением срока вождения автомобиля изменяется средняя аварийность (в общем, снижается), по мере увеличения числа судимостей у преступника сокращается срок его пребывания на свободе и т. д. Но в данных случаях, в отличие от функциональной зависимости, в индивидуальных случаях при определенном значении одного признака могут быть разные значения другого.

Литература

1. Виноградова Н. М., Евдокимов В. Т., Хитарова Е. М., Яковлева Н. И. Общая теория статистики. — М.: Статистика, 1998. — 312 с.

2. Джессен Р. Методы статистических обследований. Пер. с англ. Ю. П. Лукашина, Я. Ш. Паппэ; Под ред.Е. М. Четыркина. — М.: Финансы и статистика, 1995. — 446 с.

3. Елисеева И. И., Юзбашев М. М. Общая теория статистики. — М.: Финансы и статистика, 2003. — 400 с.

4. Статистическое моделирование и прогнозирование / Под ред. А. Г. Гранберга. — М.: Финансы и статистика, 2000. — 280 с.

5. Четыркин Е. М. Статистические методы прогнозирования. — М.: Статистика, 1995. — 252 с.

ПоказатьСвернуть
Заполнить форму текущей работой