Соревновательные игры

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 519. 832. 3
СОРЕВНОВАТЕЛЬНЫЕ ИГРЫ
Е. В. Ларкин, А. А. Сычугов
Предлагается подход к постановке задачи теории игр, позволяющий оценить развитие выигрыша во времени при применении различных стратегий. Предлагается задавать стратегии двумя величинами: плотностью распределения времени участия игрока 2 в игре и затраченными ресурсами. Полученные зависимости в практических случаях могут дать больше информации о поведении системы, действиях противоборствующих сторон и др.
Ключевые слова: теория игр, стратегия, случайный процесс, плотность распределения, теория вероятностей.
При решении многих практических задач приходится анализировать ситуации, в которых сталкиваются интересы двух и более враждующих сторон, преследующих противоположные цели, при этом важным является то, что результат каждого мероприятия во многом зависит от действий противоположной стороны. Например, при обеспечении безопасности всегда присутствуют, как минимум, две стороны: одна из которых защищается, другая пытается нарушить политику безопасности, разрушив систему зашиты первой стороны.
Необходимость анализировать подобные ситуации (в первую очередь в военных конфликтах и при решении экономических вопросов) породила специальный математический аппарат, названный «Теория игр» [1, 2], который, по сути, представляет собой математическую теорию конфликтных ситуаций. Цель этой теории — выработка рекомендаций по рациональному образу действий каждого из противников в конфликтных ситуациях.
Одним из основных понятий в теории игр является понятие «стратегия», под которой понимается совокупность правил, определяющих однозначно выбор при каждом личном ходе данного игрока в зависимости от ситуации, сложившейся в процессе игры. То есть, другими словами, стратегия — перечень всех возможных ситуаций, которые могут возникнуть в процессе игры и решения для каждой из ситуаций. Для анализа процесса игры составляется платежная матрица, в которой строки соответствуют стратегиям одного игрока, А = {А1, А2,…, Ат }, а столбцы — стратегиям другого игрока В = В, В2,…, Вп}, на пересечении записываются выигрыши одного игрока и, соответственно, проигрыши другого: Су, I = 1… т, ] = 1… п, где т, п — количество стратегий первого и второго игрока соответственно.
Для решения антагонистических игр используется принцип мини-
макса.
В1 В2 ВВ Вп
А1 си С12 Си С1п
А2 С21 С22 С2 В С2п

Аг Сц С, 2 Св Ст

А Сп1 Сп2 Ств Стп
В теории игр, независимо от типа игры, стратегии описываются статически, то есть каждая стратегия не зависит от времени. Если же стратегия претерпевает временные изменения, то это требует перестройки платежной матрицы и, в общем случае, новое решение игры. Либо каждое возможное изменение стратегии должно найти свое отражение в исходной платежной матрице. В практических случаях это затруднительно, а то и вовсе невозможно, поэтому представляет интерес разработка математического аппарата, который позволил бы преодолеть указанные трудности.
В теории дифференциальных (динамических игр)
[3] математическая модель игрызадается векторной системой обыкновенных дифференциальных уравнений, описывающих изменение параметров исследуемой системы.
Пусть стратегияописывается следующим множеством величин:
я? = / (I), я? (I)}
где /? (I) — плотность распределения времени участия игрока 2 В игре со
стратегией $(время стрельбы по цели, время воздействия разрушающих
?
факторов и т. д.), при этом |/^ (I)У = 1- Я? (I) — функция, описывающая
0
ресурсы, вложенные игроком 2 В игрусо стратегией при этом
?
|Я? (I)У = Я? — суммарный ресурс, которым располагает игрок 2при 0
применении стратегии $¦.
Тогда стратегии каждого из игроков, А и Сбудут заданы в следующем виде:
$А = / (I)ЯА (I)/ (I). Я2А (I)]-/ (I Ж (I)} (1)
Я5 = |/В (г), Я1 В (г)}{/2 В (г), я2 В (I (I)яЦ (I)}}
Следует отметить, что /^ (I) фактически представляет собой случайный процесс, заданный своей плотностью распределения.
Платежная матрица при такой постановке задачи примет вид:
№ «1 Я _ Л 1 К (г) 1 /2(/), 02 _ Л 1 к (/) 1 0в_ [/? (/ & gt-1 7 1 Кв (/) /п (/), 0п _ Л 1 К ('-) 1
0А _ 01 _& lt- ^ о-- V. — с11(/) с12 (/) с1 ](/) с1п (/)
Я. _¦ /А (/) К. (/) _ с21(/) с22 (/) с2 ] (/) с2п (/)

0. _¦ ^ О-- V. У с/1(/) с 2 (/) су (/) ст (/)

_ °т ~'- /. т (/) кт (/), ст1(/) ст2 (/) ст] (/) стп (/)
Зависимость су (/) будет иметь, в общем случае, нелинейный вид (рис. 1).
Затраченныеигроком, А ресурсы при применении стратегии Б. по-
А
зволяют получитьк моменту времени т некоторый выигрыш г, который, в общем случае, будет определяться затраченными ресурсами к этому моменту времени, то есть гА (т)_ | ЯА (г)Л. Игрок В затрачивает ресурсы,
0
в
применяя стратегию Б. с целью противостоять игроку, А в достижении своей цели, при этом результат противодействия также определяется затрат
ченными игроком В ресурсами: г. (т)_ | Я. (/)& amp-. Таким образом, итоговый
0
выигрыш игрокаА, в данном случае, без учета вероятности выигрыша к моменту времени т определяется:
тт
г. (т) _ гА (т) -гВ (т) _ IЯА (/)Л -1 яВ (/)ж
00
ВыигрышигрокаА к моменту времени т при применении им страте-
А В
гии Б., а игроком В стратегии Б. будет определяться по следующей зависимости:
с7(т) _ Г. (т) Р/А /)(/ _ т), (2)
где р, а ^ М _ т) — вероятность того, что игрокА выиграл к моменту вре-11 (/)
мени т, то есть случайный процесс /А (/) закончил работу к этому моменту, а случайный процесс /В (г) продолжает работать- г/(т) — выигрыш
А В
игрока, А при применении им стратегии Б., а игроком В стратегии Б., к
моменту времени т.
Как видно из рис. 1 выигрыш игрокаАк моменту времени т может быть как положительным так и отрицательным. Это позволяет ставить вопрос о целесообразности применения стратегии Б. в течение времени т и, соответственно, определять минимальный интервал времени т, в течение которого применение этой стратегии целесообразно.
Исходя из сказанного, необходимое условие применения стратегии
Б. А:
с
Определение т, удовлетворяющего указанному условию может оказаться непростой задачей, учитывая нелинейный характер зависимости с7 (г). В связи с этим, целесообразным видится определение суммарного
'-У
А
выигрыша игрока Апри применении им стратегии Б. который можно определить исходя из следующих соображений.
Вероятность того, что процесс /А (г) завершится точно к моменту
времени т, а случайный процесс /. (г) продолжает работать представляет собой элемент вероятности [4]:
Р/А (')(,_ т)_ /'-А'-(т)Л (3)
Тогда, с учетом (2), выигрыш, полученный игрокомА, к моменту
времени т
с7 (т)_ Г'-(т)/'- а '- (т)й?т (4)
Проинтегрировав полученное выражение на интервале (0- ?) можно
получить суммарный выигрыш игрокаА при применении им стратегии Б. А ,
В
а игроком В стратегии Б.:
?
с'-_ 14 (т)/ А'- (т)^т (5)
0
Далее возникает задача определения зависимости / А. (т).
А В
При выборе игрокомАстратегии Б., а игроком В стратегии Б., два
случайных процесса, определяемых плотностями распределения /.А (г) и
В /
/'- (г), вступят между собой в „соревнование“, при этом суть соревнования в данном случае не может быть определена однозначно, а зависит от рассматриваемой ситуации.
Пусть выигрышным считается тот случайный процесс (и, соответственно, игрок получает свой выигрыш), который завершился первым, то есть необходимо определить плотность распределения вероятностей того,
что процесс /А (г) завершился к моменту времени т, а процесс /В (г) продолжает функционировать: /• А. (т).
Функция распределения того, что хотя бы один случайный процесс из соревнующихся завершился к моменту времени т, может быть определена следующим образом:
Т (т)_ 1 -(1 — (4 — '-т)) (6)
Дифференциал этого соотношения позволяет определить плотность распределения того, что хотя бы один процесс из соревнующихся завершился к моменту времени т:
Выражение (7) представляет собой взвешенную плотность распределения вероятностей того, что случайный процесс, описываемый плотностью/А (г), закончил работу первым к моменту времени т, то есть с этого момента находится в ожидании окончания процесса /. (г).
Вес плотности в данном случае определяется как вероятность того, что процесс /А (г) завершился к этому моменту времени, а /'-($) продолжает функционировать. Вероятность того, что процесс /А (г)завершится точно к моменту времени т, представляет собой элемент вероятности [4]:
р ^ а (г)(г _т)_ /А №т (8)
Вероятность того, что к этому моменту процесс /'-() будет продолжать функционировать, определяется следующим образом:
Р/В (/)(/ & gt-т)_ 1 -'-т) (9)
Так как случайные процессы в рассматриваемом случае функционируют независимо друг от друга, то справедливо следующее выражение:
Р (_ т1ЛА (гIг & gt- т//В (г))_ Р^А (г)(г _ т) — Р^В (г)(г & gt- т) _
_ /А (& quot-4- (т))^т
Интегрирование полученного выражения в интервале (0 ^?) позволяет определить вероятность того, что процесс /А (г) завершился к моменту времени т, а процесс /'-(г) продолжает функционировать, то есть вес
(7):
Р'- _?/А (т)(1 -(т))/т (11)
0
Таким образом, плотность распределения вероятностей того, что процесс /А (г) закончил работу первым к моменту времени т примет вид:
^ ьА (4-^ (х))+. /В (4 — ^ (.» (12)
^ г I-- 7У/? / 47
I. /^ (.)(1 — (.)ях
0
Таким образом, учитывая выражение (5), суммарный выигрыш иг-рокаА к моменту времени х будет определяться следующим выражением:
^=-14 («/Л. «-^ & gt-! & lt-. *-уА Ц», 15|
0 I /гА М (1 — ^ (х))^
0
Выражение (12) представляет собой плотность распределения случайной величины, для которой, как и для любой случайной величины, представленной плотностью распределения, могут быть найдены начальные и центральные моменты.
Математическое ожидание закона распределения (12) вычисляется следующим образом:
? /X? /, А (.)(- р? (.))+ /В (х)(1 — Р1А (.) —
~ = I/ - }(.)<-!.= 1. 1? 1 11--'-Л (14)
0 I /А (.)|1 — у
0 0 І /А М (і - М^т
0
Полученное значение будет представлять собой среднее время при-
а в
менения игроком^ стратегии Б, а игроком В стратегии Б?.
Характеристику разброса среднего времени можно определить через дисперсию:
?
^Т= І (т-~)2/ А І (т)^Х =
0
= 7(^2 /їА (4 -РВ (х))+ /?(4 -РА (т^ (15)
^ / ГУЛ /
0 I /г (х)(1 — У1
0
Дальнейшее решение игры видится в двух возможных подходах.
Подход 1. Решение игры в полных выигрышах.
В качестве выигрыша здесь необходимо использовать оценку суммарного выигрыша при применении каждой пары стратегий (1) игроков, А и В, которую можно определить (13). В этом случае необходимо применять известные методы решения игр [1, 2], в том числе, принцип минимак-са для определения верхней и нижней средней цены игры, решение игры в
чистых и смешанных стратегиях.
Этот подход позволяет оценить возможный выигрыш каждой стороны при использовании всех ресурсов, задаваемых стратегиями, однако это решение не даст полной картины развития выигрыша во времени, что на практике может оказаться не всегда удобным, однако для сравнительно быстрой оценки ситуации этот подход представляется весьма приемлемым.
Подход 2. Решение игры в минимальных ресурсах
Как было отмечено выше, постановка задачи игры в виде (1) дает оценку развития выигрыша во времени. Это позволяет определить как минимально возможное время применения стратегии игрокомА для получения выигрыша, отличного от нуля, так и интервал времени, в течение которого следует применять стратегию с целью получения максимального выигрыша Cij.
Предложенная в статье постановка задачи теории игр позволит определить зависимость выигрыша от времени при применении различных стратегий, что в практических случаях может оказаться полезным и дать больше информации о поведении системы, действиях противоборствующих сторон и др. Дальнейшее развитие предлагаемого подхода требует разработки аналитических методов решения поставленной задачи, в частности решения задачи в минимальных ресурсах.
Список литературы
1. Е. С. Вентцель. Элементы теории игр. Популярные лекции по математике. // М.: Физматгиз, 1961. 70 с.
2. Дж. Фон Нейман, О. Моргенштерн. Теория игр и экономическое поведение. // Перевод с англ. под ред. и с доб. Н. Н. Воробьева. Главная редакция физико-математической литературы изд-ва Наука, 1970, 707 с.
3. Вайсборд Э. М., Жуковский В. И. Введение в дифференциальные игры нескольких лиц и их приложения. // М.: Советское радио, 1980. 304 с.
4. Е. С. Вентцель. Теория вероятностей // М.: Наука, 1969. 576 с.
Ларкин Евгений Васильевич, зав. кафедрой, докт. техн. наук, профессор, elarkin@mail. ru, Россия, Тула, Тульский государственный университет,
Сычугов Алексей Алексеевич, канд. техн. наук, доц., xru2003@list. ru, Россия, Тула, Тульский государственный университет
DRIVING GAMES E. V. Larkin, A.A. Sychugov
An approach to the formulation of the tasks of the theory of games, allowing to estimate development time savings by using different strategies. Features ask strategy two values: the density of the time a player'-s participation Z in the game and spending resources. The obtained dependences in practical cases can provide more information about the behavior of the system, actions npomueodop relevant parties and other
Key words: theory of games, strategy, a random process, the density of RAS distribution, probability theory.
Larkin Eugene Vasilyevich, head of chair, doctor of technical science, professor, elarkin@, mail. ru, Russia, Tula, Tula State University,
Sychugov Alexey Alexeevich, candidate of technical science, docent, xru2003@list. ru, Russia, Tula, Tula State University
УДК 681. 3
ИДЕНТИФИКАЦИЯ РАЗДЕЛЯЮЩИХСЯ ТОЧЕЧНЫХ ИСТОЧНИКОВ
А.А. Аршакян
Разработана методика идентификации разделения точечного источника. Показано, что признаком разделения источника может служить фазовая характеристика спектра сигнала. Приведен вид фазовой характеристики разделенного источника. Разработана методика идентификации разделения точечного источника.
Ключевые слова: точечный источник сигнала, преобразование Фурье, амплитудная составляющая спектра, фазовая составляющая спектра, идентификация разделения.
Одной из важных задач сопровождения целей является задача определения момента разделения ее на фрагменты [1]. Разделение осуществляется, например, при отделении отработавшей ступени многоступенчатой ракеты, при сбросе груза с борта летательного аппарата, при отстреле тепловых шашек и других подобных случаях. При разделении цели на фрагменты средства слежения должны перейти от режима сопровождения одиночного объекта к режиму сопровождения группы объектов. Например, после отделения отработавшей ступени решаются задачи продолжения сопровождения ракеты, или ее головной части и сопровождения отработавшей ступени для определения места ее падения. От точности определения момента разделения зависит эффективность сопровождения фрагментов. Поэтому механизм определения момента разделения цели на фрагменты должен быть максимально простым и эффективным.

ПоказатьСвернуть
Заполнить форму текущей работой