Прогнозирование экстремальных ситуаций на основе анализа многомерных разнотипных временных рядов

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

---------------------------------------- © Г. С. Лбов, В. Б. Бериков,
М. К. Герасимов, 2009
УДК 519. 6
Г. С. Лбов, В. Б. Бериков, М.К. Герасимов
ПРОГНОЗИРОВАНИЕ ЭКСТРЕМАЛЬНЫХ СИТУАЦИЙ НА ОСНОВЕ АНАЛИЗА МНОГОМЕРНЫХ РАЗНОТИПНЫХ ВРЕМЕННЫХ РЯДОВ
Рассмотрена общая постановка задачи и алгоритм построения логиковероятностной модели для распознавания экстремальных ситуаций на основе анализа многомерных разнотипных временных рядов с использованием класса логических решающих функций от разнотипных переменных.
Ключевые слова: экстремальная ситуация, прогнозирование, короткие временные ряды, логические функции.
щ я усть рассматриваемые объекты (явления) описываются
.И. Л. набором переменных разных типов (качественных и количественных) — при этом сочетания некоторых значений переменных определяют «экстремальные» ситуации. Изменяющиеся по времени характеристики объектов образуют многомерный разнотипный временной ряд. Таким образом, исследуемому объекту соответствует траектория в многомерном разнотипном пространстве. Задача заключается в прогнозировании моментов времени, когда возникает экстремальная ситуация.
Важно отметить, что экстремальные ситуации — это, как правило, редкие события, к которым приводят уникальные сочетания причинно-следственных связей изучаемого сложного объекта (явления). Отсюда возникает необходимость в анализе как можно более богатой комплексной информации.
При анализе многомерных временных рядов необходимы новые математические постановки задач и разработка соответствующих методов. Трудность решения поставленной задачи заключается не только в многомерности, но и в разнотипности временных рядов.
В настоящее время существует достаточно большое число методов прогнозирования экстремальных ситуаций. Имеющиеся методы используют различные вероятностные модели (теорию марковских процессов, теорию случайных точечных процессов и т. д.). При использовании данных методов обычно предполагается, что исходная информация представляет собой реализацию случайного
одномерного или двумерного процесса. Однако анализ коротких временных рядов с целью прогнозирования экстремальных событий — практически неразрешимая задача. Методы прогнозирования экстремальных ситуаций должны учитывать следующие часто игнорируемые особенности:
• реально происходящим в природе событиям необходимо давать комплексное описание, содержащее информацию не только о прогнозируемой величине, но и о других факторах, потенциально влияющих на прогноз-
• необходимо обрабатывать не только количественную, но и качественную информацию (т.е. многомерные временные ряды, включающие числовые, символьные, булевы последовательности) —
• задачу необходимо решать в условиях, когда имеющиеся ряды имеют относительно малую длину. При этом за основу принимается следующая гипотеза. Предполагается, что изучаемый процесс удовлетворяет определенным неслучайным закономерностям, число которых невелико (10−20), по которым можно достаточно надежно прогнозировать возникновение события по заданной предыстории. Решение многих прикладных задач показывает, что эта гипотеза часто бывает в действительности верна.
В [1] показано, что для обработки разнотипных временных рядов наиболее подходящим классом решающих функций является класс логических решающих функций от разнотипных переменных. При использовании этого класса исходная задача анализа многомерного временного ряда сводится к задаче распознавания образов на основе анализа таблиц данных.
Пусть объект, а некоторой генеральной совокупности Г описываются набором переменных Х (а) = (Х1(а),…, Х](а),…, Хп (а)). Данный
набор может одновременно содержать качественные (бинарные, номинальные, порядковые) и количественные (дискретные и непрерывные) переменные. Каждому объекту, а также соответствует целевая количественная переменная Y. Обозначим через Dj область определения переменной Х], D =, Dy — область оп-
ределения переменной Y. Рассматриваемая задача состоит в том, чтобы по имеющимся характеристикам объекта, а еГ предсказать значение целевой переменной Y.
Построение логической решающей функции осуществляется путём разбиения множества D на М подмножеств, а = (Е1,_Е',_ЕМ}, 1 & lt- М & lt-<-х>-, причём каждое подмножество
п
Е*,* = 1,…, М задано в виде Е' = ^Е*, где Е* с Б], если jе 1', и
]=1
Е* =, и если ^ 14, 14 = Ц,…,. Ьп,}, т* & lt- п. Такому разбиению соответствует набор решений г (а) = (э1,…, э *,…, э М), где s * - номер образа, приписываемый подмножеству Е *, э * = {1,2}, где 1 соответствует экстремальной ситуации, а 2 — отсутствию таковой. В общем случае совместная вероятность Р (у, х), называемая стратегией природы, неизвестна, и оценивается по обучающей выборке Р (э, 1-) = Р^(а) = э, Х (а) е Е*). Паре (а, г (а)) соответствует решающая функция f. Оптимальной решающей функцией будет f (М), для которой оценка вероятности ошибки
М 2 _
^(а, г (а)) = р = ХХР (8,*) = т1п^г, где Фм — класс решаю-
() аефм
э* 2
щих функций. В работе [2] предложен алгоритм поиска дерева решений, оптимального по заданному критерию качества. На основе алгоритма разработан метод прогнозирования экстремальных событий, использующий байесовские интервальные оценки риска. Для этого применяется байесовская модель распознавания конечного множества событий [2].
При распознавании редких событий возникает также задача оптимального преобразования переменных, при котором максимизируется расстояние до области, соответствующей редким событиям (выбора «весов» переменных). Для решения этой задачи необходимо проводить многоэкстремальную оптимизацию на симплексе. Расстояние между двумя областями [3] в многомерном разнотипном пространстве D определяется так, чтобы оно наилучшим образом соответствовало расстоянию между соответствующими областями в области определения переменной У.
Разработанный метод был использован для прогнозирования экстремальных событий (маловодий) на реке Обь (г. Барнаул, Колпаше-во) по наблюдениям за 1922 — 2000 гг. В качестве исходных данных для прогнозирования использовались среднемесячные данные по
температуре, осадкам, расходу воды. Рассматривалась следующая задача. Требуется прогнозировать маловодье в марте по данным ноября. В результате применения разработанного алгоритма были найдены решающие правила, для которых средняя частота ошибок 1-го рода на скользящем экзамене составила от 0 до 0,14 (т.е. в последнем случае было неправильно предсказано одно маловодье из семи) а средняя частота ошибок 2-го рода на скользящем экзамене от 0,13 до 0,26.
Работа поддержана грантом РФФИ № 09−07−12 087-офи_м ---------------------------------------------- СПИСОК ЛИТЕРАТУРЫ
1. Лбов Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений. — Новосибирск: Изд-во Института математики, 1999.
2. Лбов Г. С., Бериков В. Б. Устойчивость решающих функций в задачах распознавания образов и анализа разнотипной информации. — Новосибирск: Изд-во Института математики, 2005.
3. Лбов Г. С., ГерасимовМ.К. Введение расстояния между логическими вы-
сказываниями в задачах прогнозирования // Искусственный интеллект. № 2, 2004 — С. 105−108. ВШЭ '-
Lbov G.S., Berikov V.B., Gerasimov M.K.
PREDICTION OF EXTREME SITUATIONS ON THE BASIS OF ANALYSIS OF MULTIDIMENSIONAL HETEROGENEOUS TIME SERIES
We consider general statement of the problem and the algorithm for construction logical-and-probability model for recognition of extreme situations on the basis of analysis of multidimensional heterogeneous time series with use of the class of logical functions from heterogeneous variables.
Key words: extreme situation, prediction, short time series, logical functions.
— Коротко об авторах ---------------------------------------------------
Лбов Геннадий Сергеевич — доктор технических наук, профессор, Е-таіі: 1Ьоу@таШ. nsc. ru
Бериков Владимир Борисович — доктор технических наук, доцент, Е-таіі: berikov@math. nsc. ги
Герасимов Максим Константинович — lbov@math. nsc. ru Институт математики им. С. Л. Соболева СО РАН.

ПоказатьСвернуть
Заполнить форму текущей работой