О практической реализации нелокального улучшения в нелинейных задачах оптимального управления

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 517. 977 ББК 22. 16
© А. С. Булдаев, О. В. Моржин
Россия, г. Улан-Удэ, Бурятский государственный университет E-mail: buldaev@bsu. ru, oleg_morzhin@bsu. ru
О ПРАКТИЧЕСКОЙ РЕАЛИЗАЦИИ НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 1
Предлагается схема последовательных приближений для решения краевой задачи улучшения на основе метода возмущений. Итерационный алгоритм позволяет улучшать управления, удовлетворяющие принципу максимума. Приводятся иллюстрирующие примеры.
Ключевые слова: управляемая система, краевая задача улучшения, метод возмущений.
© A.S. Buldaev, O. V. Morzhin
Russia, Ulan-Ude, Buryat State University E-mail: buldaev@bsu. ru, oleg_morzhin@bsu. ru
ABOUT PRACTICAL REALIZATION OF NONLOCAL IMPROVEMENT IN NONLINEAR OPTIMAL CONTROL PROBLEMS
Scheme of the progressive approximations is offered for solution of boundary value problem for improvement on base of perturbation method. Iterative algorithm allows to perfect controls, satisfying maximum principle. Illustrating examples are considered.
Key words: control system, boundary value problem, perturbation method.
1. Постановка задачи
Рассматривается задача оптимального управления со свободным правым концом:
Ф (и) = j (x (t1)) +1 F (x (t), u (t), t) dt ® inf, T = [t0, t1], (1)
T
x (t) = f (x (t), u (t), t), x (t0) = x0, u (t) eU, t e T = [t0, t1], (2)
в которой x (t) = (x1(t),…, xn (t)) — вектор состояния, u (t) = (u1(t),…, um (t)) — вектор управления. В качестве допустимых управлений рассматривается множество V кусочнонепрерывных на T функций. Множество U с Rm полагается компактом. Начальное со-
0 ГГ'-
стояние x и промежуток управления 1 заданы.
Введем следующий набор предположений для задачи (1), (2):
1) функция j (x) непрерывно-дифференцируема в Rn, функции F (x, u, t), f (x, u, t) и их производные Fx (x, u, t), Fu (x, u, t), fx (x, u, t), fu (x, u, t) непрерывны по совокупности аргументов (x, u, t) на множестве Rn xUXT-
2) функция f (x, u, t) удовлетворяет условию Липшица по x в Rn xUXT с константой L & gt- 0: ||f (x, u, t) — f (y, u, t)|| & lt- L ||x — y||-
3) ограниченность семейства фазовых траекторий: x (t, u) e X, t e T, u eV, где X с Rn
— выпуклое компактное множество, x (t, u), t eT — решение системы (2) для допустимого управления u (t), t e T.
Рассмотрим функцию Понтрягина с сопряженной переменной y e Rn
H (y, x, u, t) = (y, f (x, u, t)) — F (x, u, t).
Работа выполнена при финансовой поддержке РФФИ (проекты 08−01−945-а, 09−01−90 203-Монг-а), РГНФ (проект 09−02−493-а).
(5)
Для допустимого управления v е V обозначим y (t, v), t е T — решение стандартной сопряженной системы
У (t) =-Hx (y (t), x (t), u (t), t), t е T, y (tj) = j (x (tj) при u (t) = v (t), x (t) = x (t, v).
С помощью отображения
u*(y, x, t) = argmaxH (y, x, w, t), ye Rn, xе Rn, tе T,
неУ
принцип максимума для управления и е V представляется в виде
u (t) = и* (y (t, u), x (t, и), t), t е T.
В работе [2] показано, что для улучшения допустимого управления и0(t), t е T в задаче (1) — (2) достаточно решить специальную дифференциально-алгебраическую краевую задачу
x (t) = f (x (tX u* (p (tX x (t), t), t), x (to) = xo, (3)
p (t) = - Hx (P (t), x (t, u °X u 0 (t Xt) — r (t), (4)
r (t), x (t) — x (t, u0)^ = A x (t) H (p (t), x (t, u0), u 0(t), t) -- (Hx (p (t), x (t, u0), u0 (t), t), x (t) — x (t, u0)^,
p (ti) = -^x (x (t^ u 0)) — q, (6)
(^, x (ti) — x (tl, u= AX (h) j (x (ti, u0)) — (jx (x (ti, u0)), x (t) — x (tl, u0)). (7)
Тогда выходное допустимое управление, формируемое по правилу
v (t) = u* (p (t), x (t), t), t е T ,
где (x (t), p (t)), t е T — решение краевой задачи (3) — (7), является улучшающим, т. е. F (v) & lt-F (u0).
В работе [1] даны условия, гарантирующие существование решения некоторых нелинейных краевых задач улучшения, и приведены итерационные алгоритмы, сходящиеся в определенной норме к их решению. При этом используется подход возмущений рассматриваемых краевых задач. По аналогии можно обосновать условия разрешимости краевой задачи (3)-(7) и соответствующие алгоритмы возмущений.
2. Итерационный алгоритм возмущений
В качестве иллюстрации рассматривается следующая схема возмущений.
Введем параметр возмущения ее [0,1] в краевую задачу (3)-(7)
x (t) = f (x (tX u*(p (t), x (t), t), t), x (to) = xo, (8)
p (t) = -Hx (p (t), ^ u 0), u 0(t), t) — er (t), (9)
(r (t), x (t) — x (t, u0)^ = A x (t) H (p (t), x (t, u0), u0 (t), t) —
— (Hx (p (t), x (t, u0), u0 (t), t), x (t) — x (t, u°)j,
p (ti) = -jx (x (tl, u 0))-eq, (11)
x (t1) — x (t^ u0)) = Ax (h) j (x (t1, u0)) -jx (x (t1, u0) X x (t) — x (t1, u0)). (12)
При e = 0 задача называется невозмущенной. При е & gt- 0 получаем возмущенную задачу, причем значение е = 1 соответствует исходной задаче (3)-(7).
Невозмущенная задача распадается на две независимых задачи Коши для сопряженных
23
(10)
и фазовых переменных.
Для решения возмущенной задачи (8)-(12) предлагается следующий итерационный процесс при к & gt- 1
Xк+1 (г) = / (хк+1 (г), и* (Рк+1 (г), Хк+1 (г), г), г), Хк+1 & amp-) = Х0, рк+1 (г) = - Их (рк+1 (г), х (г, и0), и0 (г), г) — егк+1 (г),
(тк+1 (г), хк (г) — х (г, и0)^ = А^ И (рк (г), х (г, и0), и0 (г), г) —
— ^ Их (рк (г), х (г, и0), и0 (г), г), хк (г) — х (г, и0) ^,
Рк+1(г1) = -& amp- (х (г1, и0)) -е/к+1,
(^к+1,хк (г1) — х (г1,и 0)) = А хк (ч) ^(х (г1,и0)) — ((рх (х (г1,и 0)), хк (г) — х (г1,и 0)).
В качестве начального приближения может рассматриваться решение х1(г), р1 (г), г е Т невозмущенной краевой задачи
х (г) = /(х (гXи*(р (г), х (г), г), г) & gt- х (го) = хо & gt-
р (г) = -Их (р (г). х (г. и0). и0 (гXг) & gt- р (г1) = -Фх (х (г1,и0)).
Очевидно, р1 (г) = у (г, и0).
Трудоемкость реализации каждой итерации алгоритма аналогична трудоемкости решения невозмущенной задачи и составляет две задачи Коши.
В общем случае отметим, что сходимость итерационного процесса к решению возмущенной задачи можно гарантировать на определенных условиях лишь при достаточно малых параметрах возмущения.
3. Примеры
Пример 1 (улучшениеуправления). Рассматривается задача [4, с. 33- 1, с. 149]:
Ф (и) =11×2(t)dt ® inf, T = [0,2],
2 T
X (t) = u (t), x (0) = 1, | u (t) |& lt- 1, t є [0,2].
1 2 *
Функция H (p, x, u, t) = pu — - x. Отображение u (p, x, t) = sign p.
Поставим задачу улучшения управления u0(t) = -1, t є T, не удовлетворяющего прин-
t2
ципу максимума. Находим x (t, u) = 1 — t, p (t, u) = t — -. При этом
D xk (t)H (pk (t), x (t, u 0), u 0 (t), t) = 2 ((1 — t)2 — (^ (t))2), Hxk (t)(p'- (t), X (t, u0), u°(t ^t) =t — 1,
Итерационный процесс возмущений имеет вид
xk+1 (t) = sign pk+1 (t), pk+1 (t) = x (t, u0) — erk+1 (t), xk+1 (0) = 1, pk+1 (2) = 0,
r' & quot-(t) (x (t) — (1-t)) = 2 ((1 — t)2 — (x (t))2)-(t — 1) (x (t) — (1 — t)).
Невозмущенная краевая задача (e = 0)
. x (t) = sign p (t), p (t) = 1 — t, x (0) = 1, p (2) = 0
имеет решение pl (t) = p (t, u0), xl (t) = 1 +1, t є T. На управлении u1(t) = signpl (t) = 1, t є T, построенном на решении невозмущенной краевой задачи, происходит ухудшение управления
Ф (& quot-'-) = 2 J (1 +1)2 dt = 13 & gt-F (u0) = 2 ! (1 — t)2 dt = 3.
Для к = 1 имеем
AxH (pl (t), x (t, u0), u0(t), t) = -2t, Hx (pl (t), x (t, u0), u0(t), t) = t -1, x'-(t) — x (t, u0) = 2t,
2tr 2(t) = -2t2, r 2(t) = -t.
На первой итерации (к = 1) получаем
X2 (t) = sign p2 (t), p2 (t) = 1 -1 + et, x2(0) = 1, p2 (2) = 0.
Находим решение p2(t) = 2- t2 +1 — 22. Эта функция имеет нули в точках t1 = 2
2 1 -е
г2 = 2, являющихся моментами смены промежутков знакопостоянства функции.
1 2е 2
Момент г =------- является точкой переключения искомого управления. При е = - мо-
1 -е 3
мент г1 = 4? Т. При е = 0 имеем г1 = г0. При е = - получаем г1 = г1. Значит, точка переключения г1 принадлежит интервалу (0,2) при 0 & lt- е & lt- -.

Отметим, что при значении е = 1 формулу г =------------ нельзя применить, а функция
1 -е
е-1
р (г) = г + г — 2е превращается в линейную функцию р (г) = г — 2, которая имеет лишь один нуль в момент г1. Причем получаем управление и2(г) = и0(г).
При 0 & lt- е & lt- 1 получаем
2 2 I-1, t е [0, t1], 2
u (t) = sign p (t) = j x (t) = [1, t е (t, 2],
1 -1, t е [0, t1 ],
1 -32 22
------+ -
1 -2 2
Вычислим значение параметра 2* е | 0, — I, при котором функция
I 2J
tl 2/ 1 — 32 22 Y.
t ±---------±--------I dt
2 2−1 J
J (1 -1)2 dt + Jl t + -: 0 t1 ^ 1 —
14 523 -19 522 + 872−13
3(2−1)
3
1 ^ /, Л 8(9е — 10е2 — 2)
принимает наименьшее значение при 0 & lt- е & lt- -. Производная г (е) =----------------------.
Стационарные точки функции ?(е): е'- = 1?0,1 |, е2 = 2 е0,1 ^. Точка локального
* 2 * 5 *
минимума е*= -= 0. 4, минимальное значение г (е) = ^& quot-«0. 1852. При е точка пере-
4
ключения г1 =~» 1. 3333. Соответствующий результат
ф (и2) = А." 0. 1852 & lt-Ф (и0)
является наилучшим для текущей итерации.
Таким образом демонстрируется принципиальная возможность нелокального улучшения исходного управления на первой итерации алгоритма.
Пример 2 (улучшение особого управления). Рассматривается задача [3, с. 214]:
F (u) = sin ® inf, T = [0,1],
x (t) = u (t), x (0) = 2, |u (t)| & lt- 1, u0(t) = -1, t e T.
Функция H (p, x, u, t) = pu, отображение u* (p, x, t) = sign p.
Имеем x (t, u0) = 2 -1, значение F (u0) = 1. Управление u0(t) = -1 (t e T) особое. Итерационный процесс схемы возмущений:
Xk+1 (t) = sign pk+1 (t), xk+1 (0) = 2,
pk) = °, pk"0) = -Pcos ^-eq+'-(xk a)),
qk *'(xk (1)) (X (1) -1) = sin p® — 1.
Поскольку pk+1 (t) ° -eqk+1 (xk (1)), процесс принимает форму
xk+1 (t) = sign (-eqk+1 (1)), xk+1 (0) = 2,
где
qk+1(xk (1)) =
• pxk (1) sin — -1
k^-, xk (1) * 1,
X (1) -1
0, xk (1) = 1.
Невозмущенная задача (2 = 0) имеет вид
X (t) = sign 0, x (0) = 2.
Положим sign 0 = 0 (как это реализуется в системе программирования Intel Visual Fortran 9). Тогда получаем
x'-(t) ° 2, u'-(t) ° 0, F (u'-) = sin^ = 0 & lt-F (u0) = 1.
Таким образом, происходит улучшение особого управления на этапе решения невозмущенной задачи.
Заключение
В реальных вычислениях применяются различные правила последовательного уменьшения параметра возмущения, начиная со значения 2=1, до достижения значения, при котором имеет место сходимость итерационного процесса. При этом расчет возмущенной краевой задачи осуществляется до первого улучшения исходного управления. Для полученного улучшающего управления строится новая возмущенная задача и процесс повторяется.
Таким образом, итерационный процесс для реализации возмущенных задач формирует в целом метод возмущений для решения задачи оптимального управления
Выделим основные свойства предлагаемого подхода к улучшению в рассматриваемом классе задач.
1. Отсутствие операции слабого или игольчатого варьирования при поиске улучшающего управления.
2. Нелокальность улучшения, обусловленная фиксированностью параметра возмущения.
3. Возможность улучшения управлений, удовлетворяющих принципу максимума.
Литература
1. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. -Улан-Удэ: Изд-во Бурятск. гос. ун-та, 2008. — 260 с.
2. Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Изв. Иркутск. гос. ун-та. Матем. — 2009. — Т. 2, № 1.
3. Габасов Р., Кириллова Ф. М. Качественная теория оптимальных процессов. — М.: Наука, 1973. -480 с.
4. Срочко В. А. Итерационные методы решения задач оптимального управления. — М.: Физматлит, 2000. — 160 с.
References
1. Buldaev A.S. Perturbation methods in problems of improvement and optimization of control systems. -Ulan-Ude: The Buryat State University Press, 2008. — 260 p. (In Russian.)
2. Buldaev A.S., Morzhin O.V. Improvement of controls in nonlinear systems on bases of boundary value problems // Irkutsk State University J. Math. — 2009. — Vol. 2, No. 1. (In Russian.)
3. Gabasov R., Kirillova F.M. Quality theory for optimal processes. — M.: Nauka, 1973. — 480 p. (In Russian.)
4. Approximate methods for optimal control. — Irkutsk, Irkutsk State Univ., 1983. — 180 p.
5. Srochko V.A. Iterative methods for solution of optimal control problems. — Moscow, Fizmatlit, 2000. -160 p. (In Russian.)

ПоказатьСвернуть
Заполнить форму текущей работой