Частично оптимальные управления решениями линейных стохастических дифференциальных уравнений

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 519. 21
ЧАСТИЧНО ОПТИМАЛЬНЫЕ УПРАВЛЕНИЯ РЕШЕНИЯМИ ЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
О Н. Бурцева
Найдены условия существования и явный вид частично оптимального управления линейным стохастическим дифференциальным уравнением в терминах прямых-обратных стохастических дифференциальных уравнений. Получен ряд вспомогательных результатов, которые имеют самостоятельное значение: теорема о виде решения безгранично делимого линейного стохастического дифференциального уравнения и теоремы о свойствах некоторых специальных операторов на пространствах решений стохастических дифференциальных уравнений.
Введение
В настоящей статье рассматривается задача управления относительно квадратичного функционала стоимости решением линейного стохастического дифференциального уравнения, стохастические слагаемые которого содержат стандартный вине-ровский процесс и центрированную пуассоновскую меру. Коэффициенты уравнения и функционала стоимости являются случайными согласованными процессами. Предположение положительной определенности коэффициентов функционала стоимости отсутствует.
Аналогичная задача рассматривалась в [5] для линейного стохастического дифференциального уравнения, стохастические слагаемые которого содержат только стандартный винеровский процесс.
Основным результом работы является теорема о необходимых и достаточных условиях частичной разрешимости рассматриваемой задачи управления в терминах прямых-обратных стохастических дифференциальных уравнений. Найдено частичное оптимальное управление. ю Пусть (Г2, Т, Р, {-7г& lt-}*>-о) — полное вероятностное пространство с фильтрацией, § на котором определены независимые центрированная пуассоновская мера и и одно-я- мерный винеровский процесс и) такие, что {^}*& gt-о является естественной фильтра-| цией, порожденной ши V, пополненной всеми Р-нулевыми элементами из Т.
Л Предполагаем, что функции И+ х -* К& quot-®"--
^ К+ х, а -V К& quot-®"-«- Я (г, и)-Ж+ хП^ К"*®& quot-*, 0{Т, шУЖ+ хП-& gt- Ет®т-
о К (Ь, в, ш): К+ хЕ^х^ -» ®п®п1 У (?, в, и): К+ хЕахП -" Кп®т — измеримые (^)г& gt-о-© согласованные ограниченные процессы- допустимый класс управлений Ыт — класс
всех {Ъ)щт, т}-прогрессивно-измеримых квадратично-интегрируемых процессов со значениями в пространстве Кт. Введем следующие обозначения: Т = Т[0, Т] -множество всех (^г*)46[о, т]-моментов остановки г со значениями в [О, Г]- Ст — класс всех (^)(е[т& gt-т]-прогрессивно-измеримых квадратично-интегрируемых процессов со значениями в пространстве А[0,Т] = и {?|? & lt-Е ТтВ (Шп), Е?2 & lt- оо}.
теГ
Рассмотрим линейное управляемое стохастическое дифференциальное уравнение:
d ((t) = [А (*)С (*) + В (г)и (г)]& lt-и + [С (*)с (*) + +
[К (?, 0) С (?) + V (?, в) и^)]и (сИ, йб), (1)
/'-
Rd
С (г) = f, t? [т, Т],
где г — (JiJtep. T] момент остановки,? ?, FT|#(Rn),. E|?|2 & lt- оо, состояние С? Ст, управление и (-) ?UT.
Определим функционал стоимости управления:
т
= e{J ic-wqwcw+ix*(()R"W]*+c®Gcm|jf-}.
T
Для т? Т и? ? Jv|jB (En), & lt- оо определим:
S{r, 0~ inf J (r,?-u (-)), П (т, 0 — (S (t,?) & gt--оо).
u (-)eWT
Заметим, что 5(Г, 0 = для? е Яг|5(Мп), ?|?|2 & lt- оо.
Определение 1. Линейно-квадратическая задача называется частично ограниченной при (т, ?)? Д[0,71], если Р (Г2(г, ?)) & gt- 0.
Определение 2. Для (т,?) G Д[0, Г] управление й (-) € WT называется частично оптимальным, если J (r, ?- й) = 5(г, ?) для ш? Г2(т, ?).
Если P (fi (r, ?)) = 1, то частично оптимальное управление будем называть оптимальным. В определении 2 состояние ?(•) называется частично оптимальным состоянием процесса, a (C (-)& gt-^('-)) — частично оптимальной парой.
1. Теорема о необходимых и достаточных условиях частичной разрешимости
Рассмотрим обратное стохастическое дифференциальное уравнение:
dp (t) = - A*p (t) + C*q (t) + y (t) dt + q (t)dw (t) + J g (t, 0) v (dt, d6), (2)
Rd
p (T) = V? TTB (W1), E?2 & lt- og где y (-)? CT. Решением уравнения (2) является {p{-), q (-), g (-,¦))¦
Рассмотрим прямое-обратное стохастическое дифференциальное уравнение:
С (^) = АССО + Вм (?) сИ + [с& lt-(*) + Ом (?) с? г^(& lt-) + /I КМ) С (& lt-) +
Я*
+ У (?, 0) м (?) и ((И^в)
+ С*д (1)+ 0((Ь)^(И + д (?)с1и)(Ь) + ^ д (Ь, 6) и ((Ы,& lt-1ву,
М*) = -
Я& quot-1
С (т) = е, Р (Г) = СС (П
(3)
Уравнение для ?(•) назовем прымым — задача с начальными данными, которая решается прямо- уравнение для (р (-), д (-), д {-,-)) назовем обратным — задача с конечными данными, которая решается обратно.
Теорема 1. Для (т, ?)? Д[0, Т] найдется частично оптимальное управление й? ЫТ с частично оптимальным состоянием С,? СТ тогда и только тогда, когда следующее прямое обратное стохастическое дифференциальное уравнение
& lt-К (Ь)
А ((?) + В и (?)
& lt-№ +
Сф) + Ом (& lt-) +
+
М*)
У К (?, 0) ССО + У (?, 0) гх (?) 1/(сИ, с1в),
нЛ
А*р (?) + С*д (?) + С}((Ь) сИ + д (?)сй*-(?) + J д (Ь, в) ь& gt-((И, сШ),
я*
с (т) = е, Р (Т) = СС (Т) допускает такое решение (((•), р (-), д (-), д (-, •))& gt- что
(4)
гп (Т10 [но (0 + вэд + ?*$(•)& quot-
= 0.
Сильное согласованное решение (С ('-)? р (*)& gt- О'-('-) & gt- '-)) уравнения (3) при? = 0 и
частично оптимальном управлением и (-)? ЫТ удовлетворяет неравенству:
Е{ С и*(?)(Ри (?) + В*р (?) -I- 0*д (Ь))сИ37г} & gt-0, и& gt-? 0(г,?).
(5)
Теорема 2. Предположим, что Я (-)-1 является {Т^^о-согласованной ограниченной симметрической матрицей, тогда для (т, ?) е Д[0, Т] найдется частично оптимальное управление й (-)? ЫТ, которое имеет вид:
«(() = -я-*)-1 [в (4)*г& gt-(«) + С (*)-д (*)], * е [г, Т].
Для доказательства теорем приведем ряд вспомогательных утверждений о виде решения линейного стохастического дифференциального уравнения и о свойствах некоторых специальных операторов на пространствах решений прямых-обратных стохастических дифференциальных уравнений.
2. Прямые-обратные стохастические дифференциальные уравнения
Рассмотрим решение однородного уравнения
с1Ф (1) — AФ (t)dt + СФ (?)& lt-&-<--(?) + J К (Ь, 6) Ф (Ь)и (сИ, с1в),
я*
Ф (о) = /, г & gt- о.
Вводя новую неизвестную функцию /(?) = |Ф (?)|-1 и воспользовавшись формулой Ито, получим для /(?) следующее уравнение
df (t) = -[Л — С2]сИ — |Ф (г)-1Сйи& gt-{1) —
Rd
Рассмотрим неоднородное линейное уравнение (2). Введем процесс f (t) = (|Ф (?)|-1. Используя формулу Ито для произведения, получим
= |Ф (?)|-1 [В — DC]u (t)dt + №(t)~l Du (t)dw (t) — - J |Ф (^)(*)|~1(1 + K (t, d))~lK{t, 9) Yu (t)u (dt, dff).
Rd
Таким образом, решение уравнения (1) имеет вид:
t
Сй = Ф (()5(()|ФМГ1 + Ф (& lt-) J |Ф (8)Г1[в-ос]и (8)& amp- +
t г
+Ф (*) J №(s)-lDu (s)dw (s)^(t) J J ^{s)-1K (s, 9)(l+K (s, e))~1Yu{s)u{ds, de)
Т Т Rd
Введем операторы:
(VTu)(.) = Ф (-) J |Ф (5)Г1[Я-ДС'-]и (5)(г5 + Ф (-) J Ms)^Du (s)dw (s) —
-Ф (*) J J Ф (8)-гК{з, 6)(1 + К (з, в)) lYu{s)v{ds, dd)-,
т Rd
Vru = (Vru)(T) — Zr ((-) = Ф (-)|Ф (т)ГЧ-
ZA (t) = Ф (7')|Ф (г)Г1е
Для каждого? € Е|?|2 & lt- оо, т) € Ст, управления и (-) е Ыт реше-
нием уравнения (1) и (2) являются ?(•) и (р (-), д ('-), д{-)) соответственно. Применим формулу Ито для произведения (*(?)р (?):
& lt-*(С (*)*Р (*)) = ~[С (*)у (*) — д (1)0*и*^) -р (г)В*и*]сИ +
+ Р (г) I [К*С№ + В*и*]и (& lt-а, с1в) + У д (1,е)и ((И, йв)+
Я& lt-* ял
+ [р (?) ((?*(*(*) + ?& gt-* «*(?)) + х* (?)9(?)]с?гу (?) +
+ У 9(4,9) [А-((,»)С*(0
я& lt-*
откуда
+
г
С{Т)Г) — Ср{т) = - У [С (4М*) — д (?)1)*и*(?) — р (*)в*и*](й +
г
Г г
11р (г)[к*С№+в*и*]и (м,(Ю)+1 [р^)(с*С^)+о*и*{ь))+С (Ыфю (г)
+
ние:
1 г
УI д (г, в)[к (г, 9) е (ь) + У*(ь, б) и*(ф (сИ,(1б) + у ! еш^м^в).
т Л& lt-1 т н& lt-1
Подставим значения операторов в уравнение, применим математическое ожида-
Я{т7*(?т? + К») -р*(^|^г} =
т
= Е{/ [в*р^& gt-+ V*) -у*(1)(гт? + ути) блТг).
т
Пусть? = 0, т] = 0, тогда
т т
Е{ У (В*Ро (?) + ?& gt-*9о (<-))^(?)^|^т} = е{ У у*(Уттх)л|^т}.
Т Г
Введем следующее обозначение: У*у = В*р0(Ь) + ?& gt-*<-7о (?), тогда равенство имеет т т
вид: Е { = Е^ / з/*(«)(Ц. и)<-й|. 7>-Пусть и = 0, 7} = 0, тогда
т
е{р5М^г} = я{ /(г,*(гт?)л|-гт}.
Подставляя Z*y = р0(т) в предыдущее равенство, получаем
г
я{2-у?|^т} = в{ I («'-(гте)& lt-й|
т
Пусть? = 0, у = 0, откуда
т
Е[гГ (9ти)?т} = Е{I [(в*Р1^) + о*д1(г)УиЦ)]сИ?т).
т
Введем следующее обозначение: У*г] = В*рх{1) + тогда
т
Е{г]*(9ти)тт} = е{! К’ХО^т}-
Пусть у = 0, и = 0, тогда е|т-*(7т?) ^| IТт. Подставим Е*г) = Р (т),
получаем
в{ч'(^)|^} = я{гх|^т}.
Сформулируем получившийся результат:
Теорема 3. 1) Пусть (р°, д°, д°) е СТ х Ст х Я? — решения уравнения (2) при? ? [т, Т] т? = 0 и пусть
(КШ) = В& gt-о (?) + О*до (?), ^[т, Г]-
= Ро (т).
(6)
Тогда операторы V*: СТ 14 Т и Z*: СТ {^ГГ|Й (КП), Еу2 & lt- оо} ограничены и удовлетворяют
т т
?'-{ [(К-«М»)л|^} = е{!у-Ц)(Уги)ит,'-У-
Е[(г-У)(,|^т} = е{ [ («'-(гт{)& lt-й|^т}.
2) Пусть [р1, д) е СТ х? т х В? — решения уравнения (2) при у (-) = 0 и пусть
007)(*) = В*Р1{1) + В*д^)& gt- *е[т, Т]- (7)
К V = Р{т).
Тогда V*: Ст -& gt- Ыт и 2*: Ст -» {ТтВ (Ш. п), Ет]2 & lt- оо} ограничены и удовлетворяют
т
Е^п*{ути)тт] = Е{1 у-г)и (г)& lt-ирту,
т
е{(г1*(2т?)гт} = Е[г-^т).
Запишем функционал стоимости в виде:
+ (?т? + утиув (гт? + %и) |^т} =
= еч*(у^ут + я + у-ск)и + С (Кагт + Квгт)? +
+ 2 ч*{у-с}гт + у-сгг)? =
= Е^и*Мти + ?*МТ? + 2 и*Нт?,
где
АГТМ = (Я + + К*& lt-Ж)и Ум? ^т-
Яг? = (у-^г + К*С^Т)? ^ е ^& gt-|Б (ЕП),?'-|?|2-
Щи = (адк + Уи € ^т-
Мт? = (?-& lt-22т + 6 ^Т|?(1Г), Е?2.
Теорема 4. /) Предположим, что линейно-квадратическая задача частично ограничена при (т,?) € Д[0, Т], тогда
Е^и*ИТи & gt-0, Уи € г^т, о-? 0(т, ?). (8)
2) Для (т, ?) 6 Д[0,Т] существует частично оптимальное управление й Е ЫТ тогда и только тогда, когда неравенство (8) является верным и
^(т, 0 (^тй + = 0- (9)
Доказательство. По определению частичной ограниченности условие 1 выполняется.
Необходимость. Пусть для (г,?) € Д[т, Т] найдется частично оптимальное управление и € ЫТ. Введем обозначение П0 = Рассмотрим разность функци-
оналов:
^(т, гл Ч- ей) — 7(т, ?-й) = ?'-{2гй*ЛГги + е2и*Мти + 2еи*Нт? + |^& gt-}-18 О. Н. Бурцева. Частично оптимальные управления решениями ЛСДУ
Тогда
О & lt- -/п0(. /(т,?-и + ей) — J (т,^^, u)) -& gt- 210Е{и*Мти + и*Нт^т} =
е
= 210Е{и*(Мтй + Нт?)Рт}.
Если и — - (Л^й + Ят?) ?ЫТ, то предыдущее неравенство имеет вид:
О
& lt- 1ПоЕ{(-(Мтй + Нт^(Мтй + Ят?+)Тг) = 1п0е{ - (ад + Нг^ту
Тогда Е^1п0
А1ти + Ят? = 0.
Следовательно, равенство (9) является верным.
Достаточность. Если для й? Ыт выполняются (8) и (9), то для любого и? Ыг получаем
/по{^М-м) — J{т, Z¦, u)} = /п0?{м*ад + 2и*Нт? — гад — 2й*Ят^т} =
= Е^1По (и — й)*Мт (и — й)|^г} & gt- 0.
Тогда управление й частично оптимально.
Теорема 5. 1) Если для каждого и (-)? Ыт сильным согласованным решением
уравнения (3) при? = 0 и? ? [т, Г] является ((о, Ро, Яо, 9о)& gt- то
АТТи = Ди (?) + В*ро (Ь) +. О*до (?))
Н*и = р0(т).
2) Если для каждого? ? ^^(Ш1), Е?2 & lt- оо сильным согласованным решением уравнения (3) при и (-) = 0 и Ь? [т, Т] является (СъРь 9), то
нТ? = в*Р1{г) + о*Я1(г),
Мт? = Р1{т).
3) Если решением уравнения (3) для каждого (?,"(¦))? (^& gt-|Б (МП)) х (Ыт)
при? 6 [г, Т] является (С, Р, Я^9г)& gt- т0
иТи + ят? — яи (г) + в*р (г) + ?& gt-*?(*).
Мг? + Н*и = р (т).
Доказательство. Пусть? = 0, тогда ЫТи = (Я + У*СР/Т + У*СУт)и. Из теоремы 3 известно, что У*у = Я*р0(?) + ?& gt-*до (?) при г] = = 0. Подставляем у — (?(в
предыдущее равенство:
ут*(эс = к*& lt-2К» + ут& lt-эгт? = у-& lt-эути = в*Ро{1) + ?& gt-*9о (*) —
Тогда
Ыти = Ни + У*(^Ути — Ни + В*ро{1) + ?*до (?).
Из теоремы 3 известно, что г*у = Ро (т), где у = & lt-5С. (2 = 0, тогда = г*ОУти = ро (т). Подставляем и получаем: #*и = 2т*С}Ути = р0(т)
2. Пусть и = 0. Рассмотрим #т? = (Ут*С}2г + У*СЕТ)^. Мы знаем, что при & lt-2 = 0 выполняются следующие равенства:
у-т, = в*Р1{г) + ггъю =
Й*тг)^Р1(т) = Й*тС^.
Тогда
#т? = = в*Р1(?) + п*Я1(г),
мг? = ё-с2т)€ = Р1(т).
3. Доказательства теорем
Из теорем 5 и 4 получаем, что решением уравнения 4 является (((¦), р (-), д (-), д (-, ¦))& gt- и Для частично оптимального управления й (-) е Ыг выполняется
•^п (т, о (#т» + Нт (?) = 7П (тС) (Ди (*) + 2Гр (*) + ?& gt-*<-?(?)) = 0.
Из условия теоремы 3 при? = 0 следует:
Е{ у (ииф + В*р (*) + 0*д («),"(*))л|^г} & gt- 0.
Т
Заметим, что. Е1 |м*. Л/тг1|. 7гт| & gt- 0 для Ум е (теорема 4, пункт 1). Тогда при? = 0 имеем:
#{ J и*(?)(Рм (?) + В*р (?) + Э*^))& lt-&-!. ?>-} & gt- 0.
Теорема 1 доказана.
Используя равенство теоремы 1, получаем:
(«+ В*р (г) +1)*?(?)) = 0,
тогда
Кй= -(В*р (?) + В^(?)).
При К-1 — {^^^о-согласованной симметрической матрицей частично оптимальное управление имеет вид:
ей = -ад-1 [в (ОЧКО + С (*)*г (*)], * е [т, т].
Теорема 2 доказана.
Summary
PARTIALLY OPTIMAL CONTROL OF SOLUTIONS OF THE LINEAR STOCHASTIC DIFFERENTIAL EQUATIONS
O.N. Burtseva
Existence conditions for partially optimal control of solutions of the linear stochastic differential equations in terms of the forward-backward stochastic differential equation are found. Some results are received: theorem of control of the linear stochastic differential equations and theorem of properties of some special operators.
Список литературы
1. Гихман И. И., Скороход А. В. Стохастические дифференциальные уравнения и их приложения. Киев: Наукова думка, 1977.
2. Гихман И. И., Скороход А. В. Управляемые случайные процессы. Киев: Наукова думка, 1982.
3. Гихман И. И., Скороход А. В. Стохастические дифференциальные уравнения. Киев: Наукова думка, 1968.
4. Липцер Р. Ш., Ширяев А. Н., Статистика случайных процессов. М.: Наука, 1974.
5. Chen S., Yong J. Stochastic linear quadratic optimal control problems // Applied Mathematics Optimization. 2001. № 43. P. 21−45.

ПоказатьСвернуть
Заполнить форму текущей работой