Игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 517. 977
В. Л. Пасиков
ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ ЛИНЕЙНЫХ ИНТЕГРОДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРА С УПРАВЛЯЮЩИМИ ВОЗДЕЙСТВИЯМИ ПОД ЗНАКОМ ИНТЕГРАЛА
Аннотация. Рассматриваются игровые задачи наведения для линейных инте-гродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла и игровая задача m лиц для положения равновесия системы функционалов (типа расстояния) в смысле Нэша. При решении этих задач используется известная экстремальная конструкция академика Н. Н. Красовско-го, модифицированная к рассматриваемым ситуациям.
Ключевые слова: игровая задача, стратегия, движение, позиция игры, программный максимин, управляющее воздействие.
Abstract. The article considers aiming game tasks for linear integro-differential Volterre'-s system with control action under the integral sign. The author studies the task of aiming to the point of origin and the m distinction game task for equilibrium position of the functional system (distance type) in Nashe'-s implication. To solve such problems the researcher suggests some modifications to the well-known extreme construction by prof. N. Krasovskiy.
Key words: game task, strategy, motion, game position, policy maximin, control action.
Статья продолжает исследование [1], а также нумерацию разделов, формул, определений и теорем в [1].
Так как эволюция систем описывается линейными векторными инте-гродифференциальными уравнениями Вольтерра с управляющими воздействиями под знаком интеграла, то применение методов решения подобных задач для дифференциальных систем, развитых в [2−10] значительно усложняется.
2. Игровая задача наведения для линейных интегродифференциальных систем Вольтерра
Рассматривается конфликтно-управляемая система линейных интегро-дифференциальных уравнений Вольтерра
t t t
x (t) = f (t) + A (t)x (t) + ! к (t. s) x (s)ds +!B1 (t, s) u (s)ds -!B2 (t, s) v (s)ds ,
0 0 0
x (0) = x0.
Здесь x — «-мерный фазовый вектор- u — Г1 -мерный, v — Г2 -мерный векторы управляющих воздействий, остальные ограничения аналогичны разд. 1 [1].
Игра рассматривается на заданном отрезке [0,0] и плата изображается равенством
7(9)= {г (0)}
, т & lt- п.
(24)
Состояние системы (23) описывается соотношением согласно (8)
г (ґ) = X (ґ, 0) г0 +1X (ґ, 5)^(^, 0) А^ф (0) +1
| X (ґ, т)?(т, 5) ё т
ф (5) +
+1
((5)& lt-&- -|
)& lt-&-.
Здесь X (ґ, 5) — матрица Коши системы, а = А (ґ)а,
ґ ґ
Ф (ґ, 5) = IК (ґ, т) X (т, 5) т, ф (ґ) = /(ґ) + Ф (ґ, 0^, ?(ґ, 5) = Е +1Я (ґ, т)/т,
5 5
Я (ґ, т) — резольвента матрицы Ф (ґ, т) —
, / / ^ / ЭВ (т, 5)
Хі (ґ, 5) = ?(ґ, 5) Ві (5,5) + | ?(ґ, т) ^ V т,
5
Х2 (ґ, 5) = ^(ґ, 5) В2 (5,5) + |?(ґ, т)^^^т.
5
Будем теперь предполагать, что до момента ґ0, 0 & lt- ґ0 & lt-0, применялись некоторые допустимые управления Ю- [ґ], а после момента ґ0 полагаем Ю- [ґ], тогда состояние системы (23) в момент ґ определяется формулой (9)
г (0, ґ) = г (0, ґ0) +1
((5)& lt-&-
-I
)& lt-&-.
(25)
Задача 3. Первый игрок распоряжается выбором управления и (t)е иг и стремится минимизировать величину (24), второй игрок распоряжается выбором управления V (7)е^? и стремится максимизировать величину (24).
Здесь позиция игры определяется как пара р = {{:, х (0,t)].
Программный максимин для рассматриваемого случая определяется следующим образом:
Є0 (г (0,ґ0)) = тах
I тах
— Ч5)=^
)& lt-&-
0
0
0
-I max
u (s)=ueUs
f0
! V'-x (0, т)) (т s) dT
u (s)ds — (x (0,t0))
(26)
Исходя из (18), введем в рассмотрение функцию
t 0
e (t. x (в, t))=!![ 10 X (в, Т) Х2 (т, s) d t]v [s ]ds
+
t0 s
0
+1 max
t v (s)=veVs
! l0 X l0, T) X2 (T s) d т
t 0
v (s)ds — ! !R X (0, т)%1 (t, s) d t] u [s ]ds —
t0 s
-I max
^ u (s)=ueUs
! l0 X l0, t) X1 (т, s) d т
u (s)ds — (/0 x (0, t0)),
(27)
где /0 — вектор-строка — решение задачи (26) — {/0X (0,t)} = a (t) — решение
дифференциальной системы a = -A'-(t)a- далее вводим обозначения:
0 0 xe (t) = ! a (t)X1 (t, t) d т, ye (t) = ! а (т)х2 (т, t) d т.
tt
Производная (27) записывается аналогично (19): d 0 0
«Т = |[/0 X (0, т) х2 (т, t) d t] v (t) — max |[/0 X (0, t) x2 (t, t) d t] v —
dt vgV*
-|[/0X (0,t)x1 (t, t) dt]u (t) + max|[/0X (0,t)x1 (t, t) dt]u ,
J veUt J
или
~r = ye (t)v (t) — maxye (t)v — xe (t)u (t) + maxxe (t)u ,
dt veVt ueUt
экстремальное управление вычисляется согласно определению 4.
Теорема 4. В регулярном случае при выборе первым (вторым) игроком
стратегии Ue = Ue (t, x (0, t)), (Vе = Vе (t, x (0, t)), t0 & lt- t & lt-0, 0 & lt- t0 & lt-0, описываемой определением 2. 3, ему будет гарантирован результат игры
{x (0)m} & lt-е0(t0,xI0,t0)) ({x (0)m} ^e0(t0,xI0,t0))) при любом допустимом способе управления второго (первого) игрока.
Доказательства аналогичны доказательствам теорем 1 и 2.
Теорема 5. В регулярном случае при выборе игроками своих экстремальных стратегий ие, Vе, описываемых определением 2. 3, им будет гарантирован результат игры {х (0)т] = ?о ((, х (0,^)).
Пример. Пусть движение управляемого объекта описывается системой двух скалярных уравнений:
# t t t х () = еt +1х (^)ds +1и (^)ds -1V (^)ds,
здесь / (ґ) — еґ, К (ґ, 5) = 1, А (ґ) = 0, В (ґ, 5) = 1.
Соответствующее дифференциальное уравнение имеет вид а (ґ) = 0, тогда полагаем, что фундаментальная матрица X (ґ, 5) = 1, матрица Коши X (ґ, 5) = X (ґ)X-1 (5) = 1. Далее, как и в [10], Ф (ґ, 5) = ґ - 5, резольвента этой матрицы Я (ґ, 5) = (ґ - 5), тогда у (ґ, 5) = еЬ (ґ - 5) — х (ґ, 5) -у (ґ, 5),
ф (ґ) = еґ + ґ, ф (0) = 1.
Слагаемые в (8) определяются формулами
ґ ґ
IX (ґ, 5)/(5,0)& lt-І5ф (0) = бЬґ, IX (ґ, т)/(т, 5) dт = (ґ - 5),
dф () = ґ(-2еґ -1^ + ~2^лґ-
получаем для начального условия г (0) = 10:
ґ
г (ґ) = 10 + ^23Ьґ + ґІ -2еґ -11 +1еЬ (ґ - 5) (5)ds -1еЬ (ґ + 5)(5)ds.
0
Определяем начальную позицию игры:
3 (1 ^
(0,ґ0) — 1 + -^0 + 0(- е0 — 1 1 + 1(ґ0 — 5) [5]ds — 1(ґ0 — 5) [55-
0
тогда в начальный момент управления имеем
0
Є0 (ґo, г І0, ґ0)) = Пі ах
& quot-I тах /^Ь (0−5)и (5)ds -/ '-г (0, ґ0)
и (5)-иє ^5
0
0
г
0
Будем теперь считать, как и в [10], что игрок, распоряжающийся управлением и, выбирает его значения из отрезка [2,5], а игрок, распоряжающийся управлением V, выбирает его из отрезка [3,4]. Так как решения исходной системы — кривые на плоскости, то заключаем, что экстремальный вектор I имеет постоянное направление по прямой у = х в направлении убывания (по модулю) переменных х и у. При таком использовании ресурсов управления
решение будет приведено в начало координат, так как ие =(5,5), а
Vе =(4,4).
4. Одна игровая задача для нескольких лиц
Рассматривается интегродифференциальная система
t т t
х () = f () + А ()х () + I * (. 5) х (я)ds +21 В, 5) и (я^, х (0) = хо, (28)
0 г=1 0
ее решение по аналогии со случаем двух игроков можно записать в виде
IХ (t, Т)%/ (Т 5) d т
IX (t, т)'-Р (т, 5) d т
d ф () +
(29)
иI ()^и, 1 = 1, т — и — выпуклые компакты в Яг — X (, 5) — матрица Коши
системы, а = А ()а-
t t Ф (t, 5) = I * (, т) X (т, 5) dт, ф (t) = f () + Ф (t, 0) xо, 5) = Е +1Я (t, т) dт,
Е — единичная матрица, Я (, 5) — резольвента матрицы Ф (, 5) —
х (, 5)=у (5)В (55)+1,Т)дВ1(5)^.
Далее обозначаем
х (0, tо) = X (0,0)х0 +1X (0,)у (5,0)5ф (0) +1
^ т
+1X
0 1=1
IX (0, t) у (т, 5) d т
,¦[5 ]ds,
d ф () +
тогда состояние системы (28) в момент tо & lt- t & lt-0 определяется формулой
& quot-0
: (0, ґ) = X (0, ґ0) + 2
і-1
иі [5]ds.
Пусть также задана система функционалов
^ = {Л |7- (ul,…, ит) = Ф| (х[]), 1 = 1, т]. (30)
Задача 4. Найти такие стратегии и!,…, ит, для которых выполняются соотношения
фг- (хе []& lt-фг- ([]), 1 = 1, т. (31)
Здесь хе () — реализовавшаяся траектория х^], 0 & lt- t & lt-0, системы (28), которая отвечает стратегиям и (,…, ит — хк () — реализовавшаяся траектория х[t] системы (28), соответствующая управлениям и{ [t],…, 4−1 ^ ], ч ^ ],
4+1 ^ ^.^ ит ^ ], где и1 ^ ], 1 * к, 1 = 1, т, формируется на основе стратегии и!- ч ^ ] - реализация суммируемого по Лебегу управления, стесненного условием ик ()е и.
Если задача 4 разрешима, то набор стратегий ие ={и{ ,…, и<-т ] называется равновесным по Нэшу. Как и при исследовании аналогичной задачи в [9], будем рассматривать случай, когда Ц (,…, ит) = ||Сг- - х (0), где Сг- -
заданные точки в Яп, 1 = 1, т.
Определение 5. Тройка р = {^х (0,t), Сг-] называется позицией 1-го игрока, 1 = 1, т, в момент t, tо & lt- t & lt-0, 0 & lt- tо & lt-0- позиция р0 ={tо, х (0, ^), С1 ] называется начальной.
Определение 6. Стратегией и^ 1-го игрока, 1 = 1, т, называется многозначное отображение, которое каждой реализовавшейся позиции
р ={^ х (0, t), С1 ] ставит в соответствие некоторое непустое множество [1]
иг (х (0t), Ск)) (, х (0,t), Ск) и-
такие стратегии и соответствующие им управления называются допустимыми. Движения системы (28) определяются аналогично [3]. Будем теперь решать задачу за к-го игрока, к = 1, т, для чего запишем к-й функционал в виде программного максимина
||Ск — х (0)|| = е к (х I0, t0), Ск)= т ах [/'-(Ск — х I0, tо)) —
1г1 Г1
-1
тах
ик (5)=ик eUtk
IIX (0, т) Хк (т, s) dтuk (s)ds-
(0
тт
если
=1 и1 (5)=uгeUt ' I *к
часть этого
,¦ (s)ds
(32)
правая часть этого равенства положительна, иначе? к (о, х (0, tо), Ск) = 0- вектор, решающий задачу (32), называется экстремальным, обозначим его символом 1§, вектор-строка /к/X (0, t) является ре-
шением системы
сти
ак = -А'-()ак с краевым условием ак (0) = /о — для кратко-0
обозначим х! (о) = Iа'-к (т)Хк (т, t) dт.
t0
Предполагается, что при любом, 0 & lt- tо & lt-0, максимум в правой части (32) достигается на единственном векторе /д, т. е. рассматривается регулярный случай, причем вектор /д = /д (, х (0, ^), Ск) непрерывно зависит от позиции игры как и в [2].
Определение 7. Пусть вектор /§, 1 & lt- к & lt- т, в каждый момент tо,
0 & lt- tо & lt-0, доставляет максимум правой части (32), тогда, если позиция р = {^, х (0, ^), Ск ] такова, что? к (, х (0, tо), Ск)& gt- 0, то с этой позицией будем сопоставлять множество ик ((, х (0, tо), Ск), 1 & lt- к & lt- т, всех векторов и! с и^, которые удовлетворяют условию
хк (о)ик []= тах, хк ()ик.
ик (о)=ик =Ut
(33)
Аналогично [2] можно показать, что экстремальные стратегии, построенные по формуле (33), допустимы.
Теорема 6. В регулярном случае экстремальные стратегии ик,
1 & lt- к & lt- т, уравновешивают в смысле Нэша систему функционалов (30). Доказательство. Рассмотрим функцию
?к (, х (0, t), Ск) = /0 '-(Ск — х (0, ^))-I
ик (5)ds —
-I тах
ик (5)=ик еик
ик (5)ds —
Ш1П
Г т
Г і=1 иі (5)=иієи5 0 • і іфк
Мі (5)-'- -
0
-1 2
Г 1=1 іфк
0
' (5)-'-.
(34)
Таким образом, предполагается, что в (32), (34) все игроки, за исключение ?-го, на соответствующих промежутках выбрали управление наихудшим для себя образом, т. е. желают максимизировать (32). При ^ ^ все игроки
применяют в (34) свои экстремальные стратегии. Обозначим эту величину символом е (, х (0,!()),). Далее вычислим производную:
-г (Г) 0 9
-І = _Т/к'-х (0,т)хк (тГ)Мк (Г)+ Шах 11о'-х (0,т)Хк (тГ)ик
— J Мк (г)=Мк еик
+
т ^ т ^
+^11ккх (0,т)%і (т, Г)-тмЄ ()-2 тій 114'-х (0,т)х (т, Г)-ти. (35)
і=1 Г і фк
і=1 Мі (г)=иієи1
і фк
Будем теперь в (34), а следовательно, и в (35), заменять при Г є [г0, 0] управление к-го игрока на произвольное допустимое, а управления остальных игроков на экстремальные, тогда в правой части (35) У Г є(о, 0) суммы первого и второго слагаемых, суммы третьего и четвертого слагаемых положи- г (г)
тельны, следовательно, на (г, 0)
-
& gt-
0, функция г (г) не убывает на (о, 0)
и, таким образом, вк (о, х (0,Го), Ск)^є(0,х (0,0), Ск), где вк (0,((0,0), Ск) —
значение (34) для случая, когда к-й игрок применяет произвольное допустимое управление, а остальные игроки применяют свои экстремальные управления.
Список литературы
1. Пассиков, В. Л. Задача сближения-уклонения для линейных интегродиффе-ренциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пассиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. — 2о11. — № 2. — С. 58−7о.
2. Красовский, Н. Н. Игровые задачи о встрече движений / Н. Н. Красовский. -М.: Наука, 197о. — 42о с.
3. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин — М.: Наука, 1974. — 456 с.
4. Субботин, А. И. Оптимизация гарантии в задачах управления / А. И. Субботин, А. Г. Ченцов — М.: Наука, 1981. — 288 с.
5. Красовский, Н. Н. Управление динамической системой / Н. Н. Красовский -М.: Наука, 1985. — 518 с.
6. Осипов, Ю. С. Дифференциальные игры систем с последействием / Ю. С. Осипов // ДАН СССР. — 1971. — Т. 196, № 4. — С. 779−782.
7. Осипов, Ю. С. Альтернатива в дифференциально-разностной игре / Ю. С. Осипов // ДАН СССР. — 1971. — Т. 197, № 5. — С. Ю25-Ю25.
8. Субботин, А. И. Экстремальные стратегии в дифференциальных играх с полной памятью / А. И Субботин // ДАН СССР. — 1972. — Т. 2об, № 3. — С. 552−555.
9. Субботин, А. И. Дифференциальные игры с полной памятью. Экстремальные стратегии в позиционных дифференциальных играх / А. И. Субботин. — Свердловск, 1974. — С. 211−233.
10. Гороховик, В. В. О линейных дифференциальных играх нескольких лиц /
B. В. Гороховик, Ф. М. Кириллова // Управляемые системы. — 1971. — № 1о. -
C. 3−9.
Пасиков Владимир Леонидович
кандидат физико-математических наук, доцент, кафедра математического анализа и информатики, Орский гуманитарно-технологический институт (филиал) Оренбургского государственного университета
E-mail: pasikov_fmf@mail. ru
Pasikov Vladimir Leonidovich Candidate of physical and mathematical sciences, associate professor, sub-department of mathematical analysis and informatics, Orsk Humanitarian Technological Institute, branch of Orenburg State University
УДК 517. 977 Пасиков, В. Л.
Игровые задачи наведения для линейных интегродифференциа-льных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. — 2012. — № 2 (22). — С. 50−58.

ПоказатьСвернуть
Заполнить форму текущей работой