Оптимальное решение одной задачи распределения ресурсов

Тип работы:
Реферат
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Известия Тульского государственного университета Естественные науки. 2015. Вып. 3. С. 81−90 = Математика
УДК 519. 6
Оптимальное решение одной задачи распределения ресурсов
Е. Н. Руренко
Аннотация. Решается задача оптимального управления одной нелинейной управляемой системы с терминальным функционалом при помощи принципа максимума Понтрягина.
Ключевые слова: оптимальное управление, нелинейная управляемая система дифференциальных уравнений, принцип максимума Понтрягина, точки переключения.
1. Постановка задачи
На фиксированном отрезке времени 0 ^ Ь ^ Т максимизируем терминальный функционал
Ф (Х (Т)) = 71 • Ж1(Т)+ 72 • Х2(Т) для управляемого процесса
х 1 = и • а1 • х1 — ?1 • х1 и € [0,1] ,
X2 = (1 — и) • а2 • Х1 — ?12 • Х2, (1)
х1(0) = х1о & gt- 0, х2(0) = х2о & gt- 0,
где а1, а2, ?1, ?2 — положительные параметры, 71 ^ 0, 72 ^ 0,71 + 72 & gt- 0.
При замене переменных х1(?) = • е, х2(?) = ?2(?) • е-^2'-1 из (1) получим систему
6 = и • а1 • и € [0,1] ,
6 = (1 — и) • а2 • 6 • е^ (2)
?1 (0) = Х10, 6(0)= Х20,
в которой V = ?2 — ?1.
Функционал в новых переменных будет
Ф (ё (Т)) = 71 • е-^т6(Т) + 72 • е-^2'-т6(Т). (3)
Обозначим а1 = 71 •, в1 = 72 • е-^2'-т.
Частный случай 72 = 0 в исходной задаче (1) особенно простой. В этом случае из (3) следует, что надо максимизировать функционал Ф ({(Т)) =
= а1?1(Т), в котором из (2) имеем ^(Ь) = х10 • еа1иЬ € [0, Т]. Очевидно, что оптимальным управлением будет и (Ь) = 1, Ь € [0, Т], причем оно единственно. Частный случай 71 =0 в исходной задаче (1) рассмотрен в [1, 2]. В данной работе рассматривается случай 71 & gt- 0,72 & gt- 0, а1 + V = 0.
2. Основной результат
Пусть V = 0. Гамильтониан имеет вид
Н = ф1 • /1 + ф2 • /2, где /1 и /2 — правые части (2), т. е.
Н (?, и, ф, Ь) = и • & amp- • (а1 • Ф1 — а2 • Ф2 • еи4) + ф2 • ?1 • а2 • еи4. (4) Для (4) запишем сопряженную систему
%Ь1 = -и • а1 • ф1 — (1 — и) • а2 • ф2 • еи4,
(5)
ф2 =0.
Для функционала (3), взяв фо = 1, в силу условия трансверсальности ф (Т) — - фо • Ф^ = 0 имеем
ф1(Т)= 71 •, ф1(Т)= а1,
^ то есть (6)
ф2(Т)= 72 • е-^т, ф2(Т)= в1.
Из (5), (6) получаем
ф2(Ь)= 72 • е-^т & gt- 0, Ь € [0,Т]. (7)
Подставляя (7) в первое уравнение системы (5), получим уравнение для ф1(Ь) в виде
ф = и • [-а1 • ф1 + а2 • 72 • е-^2•т • - 72 • а2 • е-^2•т •, (8)
причем из (6) ф1(Т) = 71 • е-^1т.
Пусть и (Ь),?(Ь), Ь € [0,Т] - оптимальная пара в задаче (2). Отметим, что управление и (^) будет оптимальным и в исходной задаче (1), и наоборот.
Согласно принципу максимума Понтрягина [3, с. 93] для оптимальных и (^),?(^) и решения ф (Ь) системы (5) почти всюду на [0,Т] выполняется соотношение максимума
Н (аг), и (Ь), ф (Ь), г) = тах Н (?(Ь), и, ф (Ь), Ь). (9)
ие[о, 1]
При вычислении максимума по и € [0,1], стоящего в правой части (9), важную роль играет вычисление максимума по и € [0,1] функции
Н (Ь, и) = и • %1(Ь) • [(Ц • ф1(Ь) — а2 • ф2(Ь) • е^], Ь € [0, Т], (10)
т.к. гамильтониан (см. (4))
Н (|, и, ф, г) = Н (г, и) + гр2 • 6 • а2 • е^. (11)
Из (2) и положительности ?1(0) = хю вытекает, что
#1(г) & gt- 0, г € [0,Т].
Отсюда в силу (11), (10) и принципа максимума оптимальное управление и (г) оказывается эквивалентным кусочно-постоянной функции, принимающей значения либо 0, либо 1 с конечным числом точек переключения, если функция
Н1(г) = а1 • ф 1(г) — а2 • ф2(г) • е& quot-* (12)
имеет конечное число нулей на [0, Т].
Из (11), (10), положительности ф2(г) (см. (7)) и ?1(г) при г € [0,Т] следует, что и (г) = 0 при тех г, где к1(г) & lt- 0, и и (г) = 1 при тех г, где к1(г) ^ 0.
Заметим, что ^(?)(см. (12)) является абсолютно непрерывной на [0,Т] и имеет на [0, Т] почти всюду суммируемую по Лебегу производную (с учетом
(7)).
к 1(г) = а1 • ф 1(г) — а2 • 72 • е-^т • V • е*.
Из (8), (12) следует, что выполняется
к 1(г) = -и • (Ц • к1(г) — а2 • 72 • е-^т • (а1 + V) • еиЬ. (13)
Заметим, что из (12), (6) будем иметь концевое условие
к1 (Т) = а1 • 71 • е-^1т — а2 • 72 • е-^т • еиТ. (14)
Пусть в точке г* € [0, Т] к1(г*) = 0. Рассмотрим два возможных варианта.
Вариант 1. а1 + V & gt- 0. Тогда в силу (13) почти всюду на [г* - 5, г* + 5] П П [0,Т] будет выполняться неравенство к 1(г) ^ -е, где числа 5 & gt- 0, е & gt- 0 достаточно малы. Отсюда вытекает, что при г € [г* - 5, г* + 5] П [0, Т] у функции к1 (г) других нулей, кроме г*, нет и к1 (г) строго монотонно убывает на этом множестве. Допустим, что правее точки г* на отрезке [0, Т] есть другой нуль г1 функции к1 (г). Тогда среди нулей функции к1 (г), лежащих правее г*, выделим наиближайший, обозначим его ?2 (очевидно ?2 — г* & gt-5). Для точки ?2 можно провести рассуждения, аналогичные вышеприведенным, и обосновать, что при г € [52 — г2, г2 + 52] П [0, Т], где 52 & gt- 0 достаточно мало, функция к1 (г)строго монотонно убывает. Из сказанного следует, что при некотором € (г*, г2) к1(г3) = 0, что противоречит определению нуля г2 функции к1 (г). Аналогично рассматривается ситуация, когда предполагается, что есть нуль г1 функции к1 (г), лежащий на отрезке [0,Т] левее г*. Таким образом, при выполнении а1 + V & gt- 0 обосновано, что функция к1 (г) имеет на отрезке [0, Т] не более одного нуля. Здесь использованы соображения из [4].
Вариант 2. а1 + V & lt- 0. Здесь можно провести рассуждения, аналогичные как в варианте 1, и обосновать, что к1 (г) имеет на отрезке [0,Т] не более
одного нуля т, причем при Ь € [0, Т] и достаточно близких к т функция Н (Ь) строго монотонно растет.
Из вышеизложенного вытекают следующие четыре случая.
Случай 1. а1 + V & gt- 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) равносильно условию для параметров а1 • 71 ^ а2 • 72.
Функция Ь, 1(Ь) корней иметь не будет, Н^Ь) не меняет свой знак, т. е. Н1(г) & gt- 0 при Ь € [0,Т). Поэтому и (Ь) = 1 при Ь € [0,Т].
Случай 2. а1 + V & gt- 0, Н1(Т) & lt- 0. Условие Н1(Т) & lt- 0 в силу (14) равносильно условию для параметров а1 • 71 & lt- а2 • 72.
Подслучай 2.1. Если Н1 (Ь) при Ь = Ь* имеет корень, то Н1(Ь) & gt- 0 при Ь € [0,Ь*) и Н1(Ь) & lt- 0 при Ь € (Ь*, Т].
Поэтому{
(1, Ь € [0,Ь*], и (Ь) = & lt-
i 0, Ь € (Ь*, Т].
Исследуя на максимум функционал, в этом подслучае получим (см. ниже), что
Ь* = Т_ 1, а2 • 72 • (а1 + V)
V а1 • (71 • V + 72 • а2)'-
Подслучай 2.2. Если Н1(Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь)не меняет свой знак, т. е. Н1(Ь) & lt- 0 при Ь € [0, Т]. Поэтому и (Ь) = 0 при Ь € [0,Т].
Случай 3. а1 + V & lt- 0, Н1(Т) & gt- 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 & gt- а2 • 72.
Подслучай 3.1. Если Н1(Ь)при Ь = Ь* имеет корень, то Н1(Ь) & lt- 0 при Ь € [0,Ь*) и Н1(Ь) & gt- 0 при Ь € (Ь*, Т], поэтому
(0, Ь € [0,Ь*),
и (Ь) = {
1, Ь € [Ь*, Т].
Исследуя на максимум функционал, в этом подслучае получим (см. ниже), что
Ь* = Т • 1п.
а1 + V 71 • а1
Подслучай 3.2. Если Н1 (Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь) не меняет свой знак, т. е. Н1(Ь) & gt- 0 при Ь € [0, Т]. Поэтому и (Ь) = 1 при Ь € [0,Т].
Случай 4. а1 + V & lt- 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 ^ а2 • 72-
Функция Н^Ь) при Ь € [0,Т] корней иметь не будет, ^(Ь) не меняет, т. е. Н1(Ь) & lt- 0 при Ь € [0,Т]. Поэтому и (Ь) = 0 при Ь € [0,Т].
Рассмотренным выше случаям будут соответствовать следующие утверждения.
Теорема 1. Если V = ц2 — ц1 = 0, а1 + V & gt- 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и (г) = 1, г € [0,Т].
Теорема 2.1. Если а1 + V & gt- 0, а1 • 71 & lt- а2 • 72, ?л1 =
Т& gt- 1. 1п а1 • а2 • 72 + а2 • 72 • V & gt- 0 V а1 • а2 • 72 + а1 • 71 • V '-
то оптимальное управление в задаче (1) и имеет вид
1, г € [0,г*] ,
и
и (г) = ,
1 0, г € (г*, Т],
где точка г* переключения определяется равенством
г* = т _ 1. 1п а1 • а2 • 72 + а2 • 72 • V V а1 • а2 • 72 + а1 • 71 • V'-
Замечание. Если а1 + V & gt- 0, а1 • 71 & lt- а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.
Теорема 2.2. Если а1 + V & gt- 0, а1 • 71 & lt- а2 • 72, ц1 =
0 & lt-Т & lt- 1. 1п а1 • а2 • 72 + а2 • 72 •
^ V а1 • а2 • ъ + а1 • 71 • V'-
то оптимальное управление в задаче (1) имеет вид
и (г) = 0, г € [0,Т].
Теорема 3.1. Если а1 + V & lt- 0, а1 • 71 & gt- а2 • 72, ц1 = ?л2,
Т & gt- -1- • 1п & gt- 0,
а1 + V а1 • 71
то оптимальное управление в задаче (1) имеет вид
0, г € [0,г*),
с
и (г) =
1, г € [г*, т],
где точка переключения г* определяется равенством
г* = т • 1п.
а1 + V а1 • 71
Замечание. Если а1 + V & lt- 0 и а1 • 71 & gt- а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.
Теорема 3.2. Если а1 + V & lt- 0, а1 • 71 & gt- а2 • 72, ц1 = ц2,
0 & lt- Т • 1п ^,
а1 + V а1 • 71
то оптимальное управление в задаче (1) имеет вид
и (Ь) = 1, Ь € [0,Т].
Теорема 4. Если V = /л2 — /л1 = 0, а1 + V & lt- 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и (Ь) = 0, Ь € [0,Т].
3. Приложение
К доказательству теоремы 2.1. Покажем, что в условиях теоремы 2. 1
точка переключения Ь* будет давать максимальное значение функционала.
Р (2) т / М € [0,Ь*]
Решая (2) при и (Ь) = & lt- 0? € (Ь* Т], получим
?1(Т)= ж 10 • еа1г*,
Ь (Т) = ж20 + Х10 • а2 • еа1г* • 1 • (еыт — еыг*). В силу (3) будем иметь функционал в виде функции ф (Ь*) = 71 • е-^т • жю • еа1г* + 72 • е-^т
V
(15)
Условие Ф^* = 0 даст единственную подозрительную на локальный экстремум точку
ь* = т — 1 • ,
V а1 • (71 • V + 72 • а2)
которая по условиям теоремы 2.1 находится внутри отрезка [0, Т]. Действительно,
ф'-(Ь*) = 71 • е-^т • жю • а1 • еа11* + 72 • е-^2т • жш • а1 • а2 • 1 еа1** • еыт-
-72 • е-^2т • ж10 • (а1 + V) • а2 • V е (а1+ы)г* = 0. Следовательно, 71 • е-^1т • а1 + 72 • е-^2т • а1 • а2 • 1 еыт — 72 • е-^2т • (а1 +
+ V) • а2 • 1 еыг* =0.
Отсюда, так как V — ц2 = -у1, имеем еыг* = 0тО '-72, то есть
vtl = vT + 1п.
1 (ы+а1) а ^2
. ж10 • а2 а11* (ыт ыг ж20 ±-• еа1г • [еы± - еыг
Нетрудно показать, что Ф& quot-(гЦ) & lt- 0 при условиях теоремы, т. е. точка г дает локальный максимум функции (15). Действительно,
Ф& quot-(г*) = 71 • е-^т • хю • а2 • еа1Ь* + 72 • е-^т • хю • а2 • а2 • 1 еа1Ь* е& quot-т-
-Y2 • e2T • Х10 • (ai + v)2 • • - e
(ai+v)t*
n vtt (7iv+72a2)•eiTai /
С учетом того, что e 1 = (v+ai) e-WJI a2 72 (см- выше), получим, вводя естественную положительную константу,
const • Ф& quot-(?1) = -Yival — Y2a2 & lt- 0,
так как по условию теоремы 2−1 v + ai & gt- 0, где ai & gt- 0, то есть v & gt- 0.
В силу непрерывности функции (15) и единственности внутри [0,Т] локального максимума точка t = t* будет давать наибольшее значение функции (15) на всем отрезке [0,Т].К доказательству теоремы 3−1- Покажем, что в условиях теоремы 3−1 точка переключения t* будет давать максимальное значение функционала-Решая (2) при
= (0, t & amp- [0,п
u (t) = i, t & amp- [t*, T],
получим
= Хлп ¦ eai (T-t*)
ii (T) = Х10 • e
6(T) = Х20 +
xio•a2
• (e — 1).
В силу (3) будем иметь функционал в виде функции Ф (^) = Yi • e-^iT • xio • eai (T-tt) + 72 • e-^T
. xi0 • a2 vt* a2 • xi0 Х20 ±-• e--
Условие Ф^" = 0 даст единственную подозрительную на локальный экстремум точку
ti = T —
i
ln
72 • a2
а1 + V 71 • а1
которая по условиям теоремы 3.1 находится внутри отрезка [0,Т]. Действительно,
Ф'-(г*) = -71 • е-^т • хю • аг • еа1(т-" + 72 • е-^т • хю • а2 • е^ = 0.
Отсюда имеем
7i • e
• P-^iT • ai • eaiT • e-ait*l = 72 • p-V2T • a2 • evt
72 • e 2 • a2 • e
7i • e-^iT • ai • eaiT = y2 • e-^2T • a2 • e (ai+v)tl,
-(ai+v)t = 7i • ai • e (ai+v)T
& quot- 72 • a2 '-
v
(а1 + V)(?1 — Т) =1п.
72 • а2
Нетрудно показывается, что ф'-'-(?Ц) & lt- 0 при условиях данной теоремы. Действительно,
ф'-'-(?*) = 71 • е-^т • жю • а2 • еа1(т-г*) + 72 • V • е-^т • жю • а2 • еыг*, ф'-'-(?*) • еа1г* = 71 • е-^т • жю • а2± • еа1т + 72 • V • е-^т • жю • а2 • е (а1+ы)г*, где
т. а. еа1т
e (ai +v)ti = --^- (см. выше).
Y2 ¦ e¦ a2
Следовательно,
& lt-b"-(t*) ¦ eait& quot-i = yi ¦ e (ai-^l)T ¦ xio ¦ a1 ¦ (ai + v),
где по условию теоремы 3.1 ai + v & lt- 0. Далее рассуждаем, как в теореме 2.1.
Пусть v = 0. Из рассмотренных выше четырех случаев в силу ai & gt- 0 остаются два первых случая, а именно:
Случай 1. hi (T) ^ 0, т. е. ai ¦ 7i ^ a2 ¦ 72. Здесь U (t) = 1 при t e [0,T].
Случай 2. hi (T) & lt- 0, т. е. ai ¦ 7i & lt- a2 ¦ 72. Здесь либо подслучай 2.1 и
f 1, t e [0,t*], u (t) = & lt-
{ 0, t e (t*, T],
либо подслучай 2.2 и и (Ь) = 0 при Ь € [0, Т].
Этим случаям соответствуют следующие утверждения.
Лемма 1. Если ц1 = ц2, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и (Ь) = 1,? € [0,Т].
Лемма 2.1. Если ц1 = ц2, а1 • 71 & lt- а2 • 72,
Т & gt- 1 — ^ & gt- 0, а1 72 • а2
то оптимальное управление в задаче (1) имеет вид
1,? € [0,Ь*],
К:
u (t) =
0, t e (t*, T],
где точка переключения t* определяется равенством
гт 1 71
t* = T--+
ai 72 ¦ a2
Замечание. Точка переключения г*в данной лемме найдена аналогично как в теоремах 2. 1, 3.1.
Лемма 2.2. Если /л1 = ц2, а1 • 71 & lt- а2 • 72,
«1 71 0 & lt-Т & lt---д
а1 72 • а2
то оптимальное управление в задаче (1) имеет вид
и (г) = 0, г € [0,т].
Замечание. По правилу Лопиталя нетрудно показать, что
1 а1 • а2 • 72 + а2 • 72 • V 1 71 11 т — 1п

о V а1 • а2 • 72 + а2 • 71 • V а1 72 • а2
Приношу глубокую признательность М. С. Никольскому за внимание к работе.
Список литературы
1. Построение оптимального решения и множества достижимости в одной задаче распределения ресурсов / Ю. Н. Киселев, В. Ю. Решетов, С. Н. Аввакумов, М. В. Орлов // Проблемы оптимального управления. М.: МАКС Пресс, 2007. Вып. 2. С. 106−120.
2. Киселев Ю. Н, Аввакумов С. Н., Орлов М. В. Построение в аналитической форме оптимального управления и множеств достижимости в одной задаче распределения ресурсов // Прикладная математика и информатика. М.: МАКС Пресс, 2007. № 27. С. 80−99.
3. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. М.: Наука, 1983. 392 с.
4. Никольский М. С. Упрощенная игровая модель взаимодействия двух государств // Вестник Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2009. № 2. С. 14−20.
Руренко Елена Николаевна (rurenko@bk. ru), к.ф. -м.н., доцент, кафедра высшей математики, Вятский государственный университет, Киров.
The optimal solution of a problem of resources distribution
E. N. Rurenko
Abstract. A problem of the optimal control of a nonlinear controlled system with terminal functional is solved using Pontryagin'-s maximum principle.
Keywords: optimal control, nonlinear controlled system of differential equations, Pontryagin'-s maximum principle, switch points.
Rurenko Elena (rurenko@bk. ru), candidate of physical and mathematical sciences, associate professor, department of higher mathematics, Vyatka State University, Kirov.
Поступила 10. 05. 2015

ПоказатьСвернуть
Заполнить форму текущей работой