Прогнозирующее управление системами со случайными параметрами и мультипликативными шумами

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

В.В. Домбровский, Д. В. Домбровский, Е.А. Ляшенко
ПРОГНОЗИРУЮЩЕЕ УПРАВЛЕНИЕ СИСТЕМАМИ СО СЛУЧАЙНЫМИ ПАРАМЕТРАМИ
И МУЛЬТИПЛИКАТИВНЫМИ ШУМАМИ
Рассматривается задача управления дискретными системами со случайными параметрами, возмущенными аддитивными и мультипликативными шумами, зависящими от состояний и управлений. Синтезированы стратегии прогнозирующего управления, позволяющие учесть ограничения на управляющие воздействия.
Одним из эффективных подходов к синтезу систем управления, получившим широкое признание и применение в практике управления сложными технологическими процессами является метод управления с прогнозирующей моделью (прогнозирующее управление) [1]. Идея этого метода, по-видимому, впервые была предложена А. И. Пропоем в работе [2] и состоит в следующем.
Пусть эволюция динамической системы описывается моделью в дискретном времени и зависит от выбора управлений п (к). На каждом шаге к при некотором заданном горизонте прогнозирования р вычисляется последовательность прогнозирующих управлений и (к/к), и (к+1/к), …, и (к+р-1/к), зависящих от состояния системы в текущий момент времени к, которая оптимизирует выбранный критерий на горизонте прогноза. В качестве управления и (к) в момент к полагают и (к) = и (к/к), тем самым получая управление как функцию текущего состояния, т. е. управление с обратной связью. Чтобы получить управление на следующем шаге, процедура повторяется для текущего момента к+1, при этом горизонт управления сдвигается на один шаг. Сходная идея, принадлежащая Н. Н. Моисееву, описана в [3].
Привлекательной чертой этого подхода является возможность достаточно просто учитывать явные ограничения на переменные состояния и управления. При этом получается стратегия управления с обратной связью, но удается избежать так называемого проклятия размерности, которое препятствует синтезу управлений с обратной связью при ограничениях, если применять традиционные подходы с использованием метода динамического программирования. При учете ограничений синтез прогнозирующих стратегий управления обычно сводится (в зависимости от выбора критерия) к решению задач линейного [2, 4] или квадратичного [5] программирования, для решения которых существуют эффективные методы [6].
В данной работе рассматривается задача синтеза стратегий управления с прогнозирующей моделью для дискретных систем со случайными параметрами, возмущенных аддитивными и мультипликативными шумами, зависящими от состояний и управлений. Проблема синтеза регуляторов для таких систем при различных предположениях о характере изменения случайных параметров без учета явных ограничений на управления рассматривалась в ряде работ [7−10]. В частности, в [7] получены уравнения синтеза линейноквадратичных регуляторов для систем с мультипликативными шумами и случайными параметрами, представляющими собой последовательность независимых случайных величин, для которых известны только первый и второй моменты распределения.
В данной работе для таких систем получены уравнения синтеза оптимальных стратегий управления с прогнозирующей моделью, которые позволяют учитывать явные ограничения на управляющие переменные.
ПОСТАНОВКА ЗАДАЧИ
Пусть объект управления описывается уравнениями
х (к +1) = | А0 [ (к), к] +? Аі [ (к), к] у, (к) |х (к) +
+ ^[0(к) к ]Чк), (1)
где х (к) — пх-мерный вектор состояния, и (к) — пи-мерный вектор управления, у (к) и ^(к) — векторы белых шумов размерностей т и пК с нулевыми средними и единичными матрицами ковариаций, причем м{(к)ут (5)}= 0 для любых к и 5- 0(к) — последовательность независимых д-мерных случайных векторов с известными первым и вторым моментами: м{б (к)}= 0(к), м{б (к)т0(к)}=(c)(к) и м{б (к)^т (5)}= 0, м{0(к)ут (5)}= 0 для любых к и 5-
АД0(к), к], ВД0(к), к] и -О[0(к), к] (] = 0, т) — матрицы
соответствующих размерностей, зависящие от 0(к) линейно- у (к) -}-я компонента вектора у (к) — м — оператор математического ожидания, символ Т означает транспонирование.
На управляющие воздействия наложены следующие ограничения
Мшт (к) & lt- 5(к) и (к) & lt- итах (к). (2)
Необходимо определить закон управления системой (1) при ограничениях (2) из условия минимума критерия со скользящим горизонтом управления
J (к + р/к) = м& lt-! ^ хТ (к + г) К1(к + г) х (к + г) +
р-1
+ ?ит (к + і/к)Я2(к + і)и (к + і/к) х (к)
(3)
Во [0 (к) к ] +? Ві [0 (к), к ]уі (к) I и (к)
где м{…/…} - оператор условного математического ожидания- р — горизонт прогноза, к = 0, 1, 2,. — текущий момент времени- Я1(к+г) & gt- 0 и Я2(к+г) & gt- 0 — весовые матрицы соответствующих размерностей.
СИНТЕЗ СТРАТЕГИЙ ПРОГНОЗИРУЮЩЕГО УПРАВЛЕНИЯ
Прогнозирующие управления определяются по следующему правилу: на каждом шаге к минимизируем функционал (3) по последовательности программных управлений и (к/к), …, и (к+р-1/к), зависящих только от состояния системы в момент к. В качестве управления в момент к берем и (к) = и (к/к). Тем самым получаем управление и (к) как функцию состояния х (к), т. е. управление с обратной связью. Чтобы получить управление и (к+1) на следующем шаге, процедура повторяется для текущего момента к+1.
В дальнейшем будем использовать следующие обозначения: для любой матрицы ?[0(к), к], зависящей от
0(к), Ф (к) = м{ф (к)к] } и Ф (к)= Т[0(к), к]-Ф (к), не
указывая явную зависимость матриц от 0(к).
Теорема. Оптимальная стратегия прогнозирующего управления системой (1) при ограничениях (2), минимизирующая критерий (3) при фиксированном горизонте управления р, определяется уравнением
і=1
0
і=1
+
+
і=1
где
Kk)= [ Q
U (k) =
Q" ]u (k),
u (k/k)
(k + p — 1/k)
H (k) =
Hp1 (k) к Hpp (k) G (k)=[G1 (k) к Gp (k)],
Umin (k) Umax (k)
Umin (k) = Umin (k + p — 1)_, Umax (k) = Umax (k + p — 0

S (k)= diag (s (k),…, s (k + p -1)), блоки которых определяются следующими соотношениями:
Hs (k) =
BQ (k + i — 1 j A Q (k + j) L12 (p — s), i & lt- s L22 (p — і)+R2 (k + і - 1),
hT
і & gt- s,
^ (к) = П=0 AT (к + 1)}^2 (- 5) & gt-
П7=& gt- (к +1) = !& gt-
6(5 +1) = L11 (5) + ^(к + р -1 -5), б (о) = Ях (к + р), (9)
А1(5) = ?^Г=оАт (к + р -1 — 5)5()1(к + р -1 — 5)+
+ МІ?" 0А] (к + р -1 — 5) б (5)Ді (к + р -1 — 5)}
А2 (5) = ?^"=0 А^Т (к + р -1 — 5) (к + р -1 — 5)+
+ м{Г"=о -ДТ (к + р — 1 — 5)6(5,. (к + р — 1 — 5)}, (11)
2 (5) = 0 5 т (к + р -1 — 5) б (РЬ (к + р -1 — 5) +
+м{г-=о В] (к+р -1 — 5)5)) (к+р -1 — 5)}. (12)
Доказательство: Выражая последовательно все х (к+і) (і = 1, р) через х (к) с использованием уравнения системы (1) и подставляя результат в критерий (3), получим 3 (к + р/к) = хт (к) L11(р -1) х (к) +
е{п АоТ (к + 5) к (р — г -1)и (к + ^к)
г=0 и=0 і
+ 2 x T (k)
p-2 p-1 __ Гj-1___
+ 2Z Z uт (k + ^k)BQT (k + r& gt-J пAQT (k + s)
r=Q j=r+1 ^s=r+1
(4)
— L12 (p — 1 — j) u (k + jlk) +
p-1
+ Z u T (k + r/k)[22 (p -1 — r) + R2 (k + r)](k + r/k)+
определяется из решения задачи квадратичного программирования с критерием вида
У (к+р/к) = ит (к)И (к) и (к) + 2хт (к^(к) и (к), (5)
при ограничениях
ит1П (к) & lt- ЗД и (к) & lt- итах (к), (6)
где 1и — единичная матрица размерности пи, 0и — квадратная нулевая матрица размерности пи- И (к), G (k) и итш (к), итах (к), ?(к) — блочные матрицы вида
_ И" (к) к И, р (к)
p-1
+ tr^Z Q (i)W (k + p -1 — і)
(1З)
где ^ означает след матрицы, Q (i), ?ц (0, ^12(/'-), ?22(/)
г-1__
определяются по формулам (9)-(12) и П А0Т (к + 5) = 1.
5=г
Выражение (13) нетрудно записать в матричном виде J (к + р/к) = хт (к)[(р) — Я{ (к)]х (к) +
(7)
(8)
+ 2 x т (k)G (k)U (k) + U T (k) H (k)U (k) +
p-1
+ HZ Q (i)W (k + p -1 — i)
(14)
где матрицы и (к), Н (к), О (к) имеют вид (4)-(8),
Ж (г) = Б (г) Б т (г) + м{/5(/),?)т (/)}.
Ограничения вида (2) должны быть выполнены для всех управлений, присутствующих в критерии. В матричном виде они запишутся как (6).
Итак, имеем задачу минимизации критерия (14) по вектору и (к) при ограничениях (6), которая эквивалентна задаче квадратичного программирования с критерием (5) при ограничениях (6).
Теорема доказана.
Замечание: размеры матриц Н (к), О (к) и и (к) зависят от выбора значения горизонта прогноза р. Если горизонт прогноза велик, это приводит к значительным вычислительным затратам, и для их сокращения можно использовать следующий прием. Положим и (к+5/к) = и (к+5+1/к) = … = и (к+р-1/к) = 0 для некоторого 5 & lt- р-1. Матрицы и (к), Н (к) и О (к) представим в блочном виде
U (k) =
U (s)(k)
Q (p-s)
H (k) =
H (s, s) (k) H (s, p-s) (k)
H (p-s, s) (k) H (p-s, p-s) (k)
в (к) = [^(к), о (р-4к)] ,
(10) после чего критерий (5) преобразуется следующим образом
Т (5)(к + р/к) = ит (к)Н (5,5) (к) и (5) (к) +
+ 2 хт (к & gt-3(5) (к)и (5) (к). (15)
Ограничения (6) примут вид
ишяЛ) & lt- S (s)(k)U (s)(k) & lt- Цт^к), (16)
где
Umias (k) =
Umin (k) n (k + s — 1
Umax, s (k) =
umax (k) Umax (k + s-1)
S (s) (k) = diag (s (k),…, s (k + s -1)).
Далее решается задача оптимизации критерия (15) при ограничениях (16) по «укороченному» вектору прогнозирующих управлений и (5)(к).
ЛИТЕРАТУРА
1. Rawlings J. Tutorial: model predictive control technology // Proc. american control conf. San Diego. California. June 1999. P. 662−676.
2. Пропой А. И. Применение методов линейного программирования для синтеза импульсных автоматических систем // Автоматика и телемеханика. 1963. № 7. С. 912−920.
3. Черноусько Ф. Л., Колмановский В. Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978.
х
u
r=Q
і=Q
і=Q
u
4. Bemporad A., Borrelli F., Morari M. Model predictive control based on linear programming — The explicit solution // IEEE transactions on automatic control. 2002. Vol. 47. № 12. P. 1974−1985.
5. Seron M.M., De Dona J.A., Goodwin G.C. Global analytical model predictive control with input constraints // 39th IEEE conf. on decision and control. 2000. Sydney. Australia. 12−15 December. 154−159.
6. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М.: Мир, 1985.
7. Домбровский В. В., Ляшенко Е. А. Линейно-квадратичное управление дискретными системами со случайными параметрами и мультипликативными шумами с применением к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2003. № 10. С. 50−65.
8. Пакшин П. В. Устойчивость дискретных систем со случайной структурой при постоянно действующих возмущениях // Автоматика и телемеханика. 1983. № 6. C. 75−85.
9. Hopkins W.E. Optimal stabilization of families of linear differential equations with jump coefficients and multiplicative noise // SIAM J.ntrol and optimiz. 1987. Vol. 25. № 6. P. 1587−1600.
10. Li X., Zhou X., Rami M. Indefinite Stochastic LQ control with jumps // Proc. 40th IEEE conf on decision and control. 2001. Orlando. P. 1693−1698.
Статья представлена кафедрой математических методов и информационных технологий в экономике экономического факультета и кафедрой
прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную
редакцию «Кибернетика» 23 сентября 2004.

ПоказатьСвернуть
Заполнить форму текущей работой