Оценка параметров нормального закона распределения по усеченной выборке

Тип работы:
Реферат
Предмет:
Общие и комплексные проблемы естественных и точных наук


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УЧЕНЫЕ ЗАПИСКИ И, А Г И Том XXI 1990
№ 2
УДК 533.6. 071. 08: 532. 57: 621. 375. 8
ОЦЕНКА ПАРАМЕТРОВ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ ПО УСЕЧЕННОЙ ВЫБОРКЕ
Ю. А. Зленко, В. Г. Шумилкин
Рассматривается задача о нахождении оценок параметров нормального закона распределения по результатам наблюдения случайной величины в ограниченном диапазоне. Оценки параметров находятся из условия максимума функции правдоподобия. Погрешность оценок ММП получена методом статистического моделирования на ЭЦВМ. Проведено сравнение дисперсий оценок, полученных ММП и нижних границ дисперсий оценок параметров распределения (границ Рао-Крамера).
Цифровые методы обработки экспериментальной информации предполагают наличие _ряда измерений изучаемого параметра или представление исследуемого случайного процесса (СП) в виде последовательности дискретных отсчетов. Статистические свойства оценок (математического ожидания, дисперсии и т. д.), построенных на основе дискретного представления СП при условии независимости отсчетов и репрезентативности выборки достаточно хорошо изучены. Однако в измерительной практике встречаются случаи, когда выборка не отвечает требованиям репрезентативности. Алгоритмы обработки таких выборок практически отсутствуют. Причина, побуждающая рассматривать модель усеченной выборки, это непланируемая потеря информации о части возможных значений измеряемой случайной величины, обусловленная несовершенством метода измерений или измерительной системы (ИС). Потеря информации может быть, в частности, связана с тем, что диапазон измерения ИС меньше диапазона возможных значений СВ. Этот случай имеет место, например, при выполнении измерений скорости потока методом ЛДИС.
ЛДИС с дифференциальной оптической схемой и определением скорости по методу дискретного измерения доплеровской частоты измеряет мгновенную скорость VI газового потока в дискретные моменты времени. Для определения средней скорости V и степени турбулентности г=а/У (где а2 — дисперсия мгновенной скорости) необходимо выполнить ряд измерений мгновенной скорости К- и затем соответствующим образом обработать результаты измерений. Алгоритм обработки должен учитывать специфические особенности работы ЛДИС. В частности, ЛДИС рассматриваемой схемы фиксирует только те значения У, величина которых заключена в некотором фиксированном интервале [Ун, Ув]. Границы интервала Ун, Ув определяются полосой пропускания фильтра на входе блока выделения доплеровской частоты. Наличие границ 1/" и Ув может привести к тому, что функция распределения зафиксированных значений скорости V, будет существенно отличаться от функции распределения мгновенных скоростей потока. Оценки средней скорости и пульсаций потока соответственно как средней арифметической и выборочной дисперсии результатов измерения в этом случае будут иметь значительные ошибки. Алгоритм оценки V и е методом максимального правдоподобия с учетом конечности полосы измерения [Ун, Vв] рассматривался в работе [1]. Погрешность оценок ММП в [1] не анализировалась. В настоящей работе исследуются статистические свойства оценок параметров нормального закона распределения по выборке, формируемой из результатов измерения в ограниченном диапазоне.
1. Случайная величина (СВ)Х имеет одномерный нормальный закон распределе-ния с параметрами тх и о0. Имеется выборка объемом п (х±… хп), из генеральной
совокупности N [тх,. Элементы выборки независимы и удовлетворяют условию ?=1, 2…, п (хн и хв-соответственно нижняя и верхняя граница вы-
о
борки). Требуется определить неизвестные параметры тх и о0 на основе (хи…, хп). л д.
Оценки параметров тх и а0 определим методом максимального правдоподобия.
С учетом независимости Xi функция правдоподобия может быть записана в виде
1& gt-Х {мх& gt- °о) = 1п Р (*i& gt- ' хп тх, 4) = 711п Р {*1 I тх& gt- °о) & gt- (!)
где р (jq… х" | тх, & lt-Jq) — условная плотность появления данного ряда наблюдений
¦(СВ)х (в диапазоне [хя, хв]), при условии, что математическое ожидание (СВ)* в генеральной СОВОКУПНОСТИ еСТЬ ГПХ И ДИСПерСИЯ.
Плотность распределения xt р (Хгтх, Oq) определяется как
Р (*/1 тх, og) =
О
ехр
(•*"
г)2/^ао]
II
J ехр [- (х — mx)*l2& lt-sl] dx
н О
(2)
Стандартная форма уравнений правдоподобия представляет собой необходимые условия экстремума функции правдоподобия (1) и с учетом (2) в данном случае может быть записана в виде
а п, А / -2 /Л -2 '-
2 _ 1 i Л '-i2 ао (- -хвЬ — -хЦг]
-о — - 2* W — тх) ±J- UBe — лгн е *'- & gt- & gt-
(3)
где
= j е dx —
—, л, Л -. л — Л
¦*" = [хв — mx) la0- *н= (*" - mx) i& lt-j0-
(Л 1А {x — mx) ia 0.
л"
Оценки параметров тх и являются корнями системы уравнений (3),
Л А"
Исследование свойств оценок тх и ад, получаемых ММП, затрудняется тем, что решить систему (3) в аналитическом виде не представляется возможным. Это значи-
А Л,
тельно осложняет задачу анализа погрешностей оценок тх и о0. В связи с этим для исследования характеристик оценок ММП использован метод статистического моделирования на ЭЦВМ. Сущность метода сводится к следующему. Используя преобразование Н. В. Смирнова [2], вычисляются п значений (СВ)*, имеющих плотность распреде-А Л2
ления (2). Оценки тх и а0 находятся из решения системы уравнений (3) модифицированным методом Ньютона. Результаты расчетов, выполненных для различных значений параметров тх, & lt-Sq, хн, хв, показали, что использование в качестве начального
приближения при решении (3) для тх средней арифметической и для «д — выборочной дисперсии обеспечивает хорошую сходимость и устойчивость итерационного процесса. В качестве математического ожидания и дисперсии оценок принимались выборочные средние и выборочные дисперсии:
Ц& gt- = лг^т2^_(^'-))2-
/=1
/=1
найденные в результате-кратного повторения описанной процедуры отыскания оценок.
Подробные параметрические расчеты были выполнены при следующих значениях
_ --- - Г, Ах Ах]
параметров: я=50-г-200- #=100- ао=5-т-40%- Д*=0,5-н2,0- тх = 11 ~ -тр, 1 + *& lt-Н !
Ах =… --в-, крайние величины интервала проанализированных значений тх
хв | ¦ Хц
соответствуют варианту, когда границы интервала наблюдения (СВ)* совпадают с тх, т. е. наблюдается 50%-ное усеченное распределение. Результаты расчетов показали, что оценки ММП не имеют систематической ошибки.
Л Л,
2. Нижние границы дисперсий несмещенных оценок тх, а0 определяются из обобщенного неравенства Рао-Крамера [3] системой неравенств
а2 & gt- у (/, о^),
(4& gt-
где
уи. ])
— диагональные элементы матрицы /-*, обратной информационной матрице Фишера. Элементы матрицы Фишера определяются из соотношений:
7& lt-/
д 1п Ьх д пЬх дг1 дГ]
д* 1п Ьх дг1 дГ]
ПХ& gt- °о)
Для рассматриваемой системы оцениваемых параметров тх, о0 и функции Ьх, описываемой согласно (3), элементы информационной матрицы I определяются следующими выражениями:
1(тх, т
/(«о- ®о).
г)=-4- + «
— -3/2 — -хЦ
V Л -х"е 1
Л0 *-
^/2_7не-4/2_

X хве
/27»
• Х± 2
•У
1
А)
+ п
_ -хЦч -з -х\ч _ -У-/2
хве 1 — х*е в1 — х"е 1 +
-о -Х~, 1
+ х& quot-е н'-
1 «I п2 ¦ ТЙ/)
(r)о) = _2и_ (Г -в2/2 _ г ^/2) + ЙГ 1 (~Хв е
Уол V / У2
-г-. -*!1--,. -*'-!'-
Л0
Х (*
X
х2'-
72/
/2 — - *2/ -Х"е
(5& gt-
Формулы (5) позволяют рассчитать диагональные элементы матрицы У^'-^& gt-
Л Л,
определяющие значения нижних границ дисперсий оценок т*, Од 120
у (?Of ®o).
/(*0& gt- 5о)
' j{. mx* mx). j (°0. ««)_ (/(тж. 3°))2 '
/(m.v. m*)
/(тж. -о) _ (,(тх, 3»))2 '-
Для нижних границ среднеквадратичных погрешностей в определении тх и & quot-о, отнесенных к Сто, из (6), с учетом (4) и (5), имеем:
1
m, ne"*= Yn I D
у (®0- «оЛ ½
1
/тх. тх)112
(7)
где
/л V IDI
ji, I = Jo_ /г. / - ^ у = Шдг& gt- «2) —
п к J
/, = /(& quot-*. **) (/& quot-jr. ••))*.
Как следует из формул (7), относительная погрешность в определении тх и Оц
обратно пропорциональна объему измерений и стремится к нулю при п оо. Отметим,
что при положении границ интервала [хв, *в] достаточно «далеко» от центра распреде-
ления
хв — тх& gt- За0- | х» — тх & gt-Зо0 и х"& gt-тх>-хн
зависимости (7) переходят в известные [3] зависимости погрешности среднего арифметического и погрешности эмпирического СКО
= о0
jVn —
(8)
/ /л
Для оценок тх и из (3) в этом случае имеем
1 Л д2 1 Д (Л 2
= 1г2-Хг: •
г=1 /-1
На рис. 1 приведены результаты сравнения средних квадратичных отклонений (СКО) ат и оценок ММП (непрерывные кривые) и границ Рао-Крамера (пунк-
тирные кривые) в зависимости от положения тх относительно центра измерительного
Ах =1,0-п=100 -М=100
Рис. 1
hx 4,0, N=300
-ммп
-границы Рай-Крамера
т. ?*0,5] во=0,Ш
интервала тх — 2тх/(хв+хн). Негладкость зависимостей СКО оценок ММП объясняется конечностью числа выборок N, по которым вычислялись & lt-зтх и & lt-Jq как выборочные СКО.
Сравнение результатов параметрических расчетов границ Рао-Крамера по зависимостям (7) и дисперсий оценок ММП показало, что они практически совпадают при объеме выборки И& gt-50-М00 (см. рис. 2).
Таким образом, при наличии нерепрезентативной выборки (СВ)* с распределением
N (тх, о2) оценки параметров тх и з2 можно оценивать по соотношениям (3), а их дисперсии согласно (7) (при объеме выборки л» 50).
ЛИТЕРАТУРА
1. Зленко Ю. А., Ш умилкин В. Г. Вопросы оптимальной обработки результатов измерений ЛДИС в турбулентных потоках. Сборник докладов. — II Всесоюзная конференция по методам аэрофизических исследований. СО АН СССР, ИТПМ, Новосибирск, 1979.
2. М, а р т и н Ф. Моделирование на вычислительных машинах. — М.: Советское радио, 1972.
3. Левин Б. Р. Теоретические основы статистической радиотехники.- М.: Советское радио, 1975.
Рукопись поступила 9/Х 1981 г. Переработанный вариант поступил 25/VII 1989 г.

ПоказатьСвернуть
Заполнить форму текущей работой