Интерактивные методы согласованной оптимизации при управлении эволюцией организационно-технологической системы

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 330. 115
ИНТЕРАКТИВНЫЕ МЕТОДЫ СОГЛАСОВАННОЙ ОПТИМИЗАЦИИ ПРИ УПРАВЛЕНИИ ЭВОЛЮЦИЕЙ ОРГАНИЗАЦИОННО-ТЕХНОЛОГИЧЕСКОЙ СИСТЕМЫ
Виноградов Геннадий Павлович,
д-р техн. наук, профессор кафедры информатики и прикладной математики ФГБОУ ВПО «Тверской государственный технический университет», Россия, 170 023, г. Тверь, ул. Маршала Конева, 12.
E-mail: wgp272ng@mail. ru
Актуальность работы обусловлена тем, что эффективность информационных технологий в системе управления эволюцией организационно-технологической системы в условиях неопределенности и риска зависит, прежде всего, от того, как люди с их помощью выявляют и воспринимают объективные признаки складывающихся ситуаций, строят оценки, формируют новое знание, на его основе вырабатывают и согласуют формы поведения.
Цель работы: обоснование возможности применения интерактивных, итерационных процедур в задачах согласованного планирования для целей выявления технологических резервов и обеспечения прогрессивной эволюции организационно-технологической системы за счет максимально полного использования креативного потенциала производственного персонала. Методы исследования: общая методология и методы системного анализа, аналитического и имитационного моделирования. В работе также используются методы теорий: нечетких множеств, активных систем, принятия решений, искусственного интеллекта, нечетких систем и нечеткого логического вывода, теории игр.
Результаты. Исследована сходимость интерактивной процедуры согласованной оптимизации в задаче управления эволюцией организационно-технологической системы, состоящей из центра и m агентов при различных вариантах информированности центра о возможностях агентов. Для случая полной информированности центра показано, что решение задачи оптимального согласованного планирования будет реализовано агентами, если найдено стимулирующее воздействие и план, при которых удельная ценность ситуации целеустремленного состояния будет превышать значение аналогичного показателя при любых других вариантах. Для случая неполной информированности центра показано, что сходимость к оптимальному решению будет обеспечена путем дополнительного стимулирования агентов за более полное раскрытие ими своих возможностей. Приведена итеративная процедура, использующая идею алгоритма блочного программирования Полтеровича. Сформулировано условие ее сходимости. Для случая неполной информированности центра о предпочтениях агентов показано, что решение может быть получено при использовании итерационного алгоритма, использующего релаксационную схему условного градиента. Приведены условия, при которых возможно построение процедуры интерактивного обмена информацией между центром и агентами, гарантирующими сходимость решения задачи согласованной оптимизации. Выполнена экспериментальная проверка предложенного подхода на примере разработки производственной программы для производства хладонов и фторопластов.
Ключевые слова:
Активная система, интеллектуальный агент, согласованная оптимизация, принятие решений, интерактивное взаимодействие.
Введение
Проблемы управления эволюцией организационно-технологических систем с учетом человеческого фактора исследуются в теории нечетких систем, иерархических систем с активными элементами, теории рыночных отношений. Фундаментальные результаты в этом направлении получены в работах Л. Заде, В. Н. Буркова, Д. А. Новикова, Д. Канемана, П. Словика, В. Н. Кузнецова, А. Г. Чхартишвили, Р. Андерсен и других [1−18]. Однако методологические и математические основы моделирования в этих работах, позволившие обосновать ряд центральных методологических принципов, были основаны на положениях нормативной теории выбора и поведения без учета индивидуальных предпочтений субъекта в полном объеме и его субъективного понимания ситуации выбора. Поэтому полученные модели механизма функционирования и управления характеризуются ограниченными функциональными возможностями. Это сдерживает внедрение полученных формальных результатов в практику создания новых информационных технологий, в частности развития систем согласования и согласованной оптимизации, и делает востребованным разработку бо-
лее реалистичных моделей согласования принятия решений, учитывающих субъективные представления людей, участвующих в процессе выбора.
Статья посвящена итерационным методам решения задачи оптимального согласованного планирования, когда центр, не обладая полной информацией о возможностях агентов, вынужден осуществлять одновременно с определением плановых заданий идентификацию модели своих представлений по отдельным ее составляющим: исходным данным, ограничениям, взаимосвязи между входами и выходами, о целевых функциях агентов и т. п. Это соответствует ситуации, когда объект управления для центра плохо поддается адекватному моделированию из-за его сложности, проблемы получения точной информации о его параметрах, неудовлетворительной структурированности, плохой формализуемости, распределения знания о предельных возможностях подсистем среди агентов. Представления центра об объекте управления в этом случае можно формализовать в виде нестационарной модели, свойства и структура которой определяются информированностью центра. Тогда используемый центром итерационный метод должен порождать сходящуюся после-
довательность представлении, которая характеризуется помехоустойчивостью, независимостью логической структуры оператора р от конкретных исходных данных. Это определяет необходимость введения в итерационный оператор р параметров, характеризующих объект, среду, интересы участников процесса, например, так {хН+1=р[ОН] хН}, Н=1,2,…, где ОН={уН, юН,…} - перечисленная система параметров (числовых, символьных, лингвистических, предикатных) со значениями на момент Н. Особенность этой схемы состоит в необходимости использования алгоритмов, позволяющих получить информацию, доопределяющую и уточняющую параметры итерационного оператора, источником которой являются взаимодействующие агенты, а средством ее получения — интерактивные алгоритмы.
Пусть на к-м шаге представления центра о возможностях организационно-технологической системы заданы как ХкаХ. На их основе он решает задачу формирования производственной программы
f (к)(х) ^ таХх еХ (к). (1)
В процессе определения оптимального плана возможны две ситуации. Первая связана с тем, что желаемое состояние для центра от его реализации совпадает с оптимальным решением задачи (1), то есть х*еХ (к). Тогда интерактивное взаимодействие центра и агента должно быть направлено на определение подмножества, содержащего х*, то есть итерационное взаимодействие центра и подсистем должно обладать свойством Х (к)сХ (М)сХ (к-1)с… сХ (1). Такой процесс будем называть локализацией решения.
Если же желаемое состояние системы х* для центра находится вне множества Х (к), то центр должен предпринять усилия для получения достоверной информации по расширению множества Х (к), то есть на к+1 должно выполняться Х (к)сХ (М). Это позволяет центру перейти от решения исходной задачи (1) к задаче вида
f (k-1)(x) ^ max/x е X (
(*+D и X (k)1
¦X,
(k +i)'-
f (k+ц (х) ^ max/x g X (i+1)
обладает свойствами frt)(x)& lt-/tt+1)(x) и X{k)aX{m. Эти свойства выполняются как к самой задаче, так для любой другой изоморфной ей.
Пусть расширение допустимого множества определяется некоторым множеством параметров состояния соеЛь. Такое расширение будем называть параметрическим. Оно обладает следующими свойствами.
fAW = sup f (х (Я)), f*(A) = sup f (x (Я)),
Л* (A) & gt- ?'-(A), VA е Ak, Xк) с X (
с +1)'-
(3)
(2)
где множество допустимых решений шире, чем на Х (к) и выполняется условие уГ4)(х)& lt-/Г4+1)(х), что определяет мотивированность центра в расширении представлений о множестве Х (к).
Такой прием будем называть расширением представлений центра за счет получения информации от агентов об их возможностях.
Определение 1. Представления Х (к) и Х (М) изоморфны, если между элементами множеств допустимых решений экстремальных задач (1) и (2) можно установить взаимно однозначное соответствие так, что для любой пары соответствующих элементов х (к)еХ (к) и х (М)еХ (М) будет выполняться ^(х)=^(х).
Определение 2. Эффективным расширением представлений центра Х (к) о возможностях агентов будем называть такое представление о множестве Х (М), для которого решение экстремальной задачи
то есть вектор оптимального плана на основе «старых» представлений не превосходит по ценности для центра выбор плана на основе новых представлений.
Действительно, если предположить, что fB*(A)& lt-f*(A), то при условии, что решение задач A и B существует, получаем fA (x& quot-)=fA>-fB. Но x*eX (k+1), а на этом множестве задачи A и B изоморфны по определению 1, то есть fB*(A)=f*(A), что противоречит предположению fB (X)& lt-fA (X). Это является доказательством неравенства (3).
Если существует последовательность w1eAk
причем Х (ю1)сХ (ю2)с… сХ (ю,) и lim®,. =юпр предельному значению, то f1*(x)& lt-f2*(x)<-… <-f (x)<-… и lim f*(x), = fp.
Это утверждение доказывается по аналогичной схеме.
Если неравенство (3) выполнено со знаком равенства, то расширение B будем называть эквивалентным, а если существует строгое неравенство, то — эффективным. Величину
A = f* - f*
будем называть показателем эффективности расширения представлений центра за счет получения дополнительной информации от агентов.
Постановка задачи
Рассмотрим задачу планирования в двухуровневой организационно-технологической системе (ОТС), состоящей из центра и m агентов, обладающих свойствами активности, автономности, креативности. Каждый агент управляет каким-либо одним технологическим узлом. План для k-го агента описывается тгмерным вектором xk={xkj, j=1,mk}, положительные компоненты которого указывают на выпускаемые продукты, а отрицательные — на затраты для выпуска заданной продукции. Возможности k-го агента по выпуску продукции описываются технологическим множеством — областью Xk в пространстве из mk измерений: любой допустимый план xk k-го агента должен принадлежать области Xk^eXk, k=T, m.
План ОТС будет описываться вектором
m
x={xk, k=1,m} с размерностьюmk = N. Очевид-
к=1
но, что x
~-X = П Xk • Допустимый план
x должен
удовлетворять также ряду глобальных ограничений вида 0(х)& gt-Ь, где 0(х)=^(х), ?=1,п}, Ь={Ь, ?=1,п}, п — количество ограничений. Будем считать, что функции & amp-(х), ?=1,п — вогнутые, дифференцируемые функции, а множество X — выпуклое множество. Тогда задача, решаемая центром, может рассматриваться как задача вогнутого программирования
/ (х) ^ тах
G (x) & gt- b, x е X = П Xk
(4)
Задача (4) является задачей оптимального планирования (ОП) [14]. Ее особенность заключается в том, что центр не знает все потенциальные возможности агентов. Поэтому ее решение зависит от информации о своих возможностях, которую агенты сообщают центру.
Пусть интересы агента описываются вектором okeOk, где Oko — множество состояний, имеющих различную ценность для агента. Значения вектора ok определяются значениями вектора ук=уы, ук2,…, укщ фактического выпуска продукции, полученными при реализации плана xk агентом. При управлении технологическим узлом свои предпочтения на множестве Oko агент реализует путем выбора значений режимных параметров zk, которые, в свою очередь, определяют значения вектора yk, а значит и ok. Справедливо условие zkeZk, где Zk — множество допустимых значений режимных параметров, определяемое технологическим регламентом. На технологический узел воздействуют различного рода возмущения xke^k, из которых часть Zk6Xk агент принимает во внимание. Поэтому SkcQk и SknQk*0 [19].
Поведение человека как интеллектуального агента, зависящее от его субъективных представлений о ситуации выбора, рассматривалось в работах [20, 21]. Показано, что принимаемое решение агентом о способе действия определяется его оценками компонент ситуации целеустремленного состояния. Их величина зависит от структуры информированности агента It, которая определяется его знаниями, убеждениями, ценностями, нормами, опытом. В этих же работах была предложена модель принятия решений агентом, позволяющая учитывать его индивидуальные оценки компонент ситуации целеустремленного состояния, которая имеет следующий вид
Pk () = ArS max (О & gt- U)
С
е Zk (I,'-X Uk eUk,
ok = ok (У) е0Т, Ук = f,(zk) еXt,
o- = {otj, j = 1, Nk}, I,? M, xk (Еф'-) & gt-xt, x2(щ) & gt-xt-,
где E% и EEk — оценки агента удельной ценности ситуации целеустремленного состояния по результату и эффективности- %f°, 1=1,2 — оценки, отражающие эмоциональное отношение агента к ситуации выбора, uk — управляющее воздействие центра.
Оптимальное решение задачи (4), учитывающей субъективное поведение агента в форме (5), практически невозможно. Проблема состоит в построении моделей выбора и интерактивного процесса обмена информацией между центром и агентами так, чтобы получить оптимальное решение задачи (4), (5) и создать для каждого агента условия для наиболее полного использования своих возможностей в интересах системы, не используя детальную математическую модель их производственных возможностей. На возможность построения таких процедур указано в работе [14].
Задача оптимального согласованного планирования
Математическая постановка задачи оптимального согласованного планирования (ОСП) имеет вид:
f (x) ^ max- G (x) & lt- b- x eX- x eS.
m
Здесь S = П sk — множество согласованных
k=1
планов, таких что
sk = {xk |max Ефк (x*, xk) & lt- Ecu (x, x)}& gt-
где
,, I ck при x. = xk
Ефк (x*& gt- xk) = Ефк (x*) + & lt-.
[0 при x. Ф xk
— целевая функция k-го агента с учетом фонда материального поощрения ck, планируемого центром за выполнение предлагаемого им плана xk- x* -план производственной программы, выбираемый k-м агентом с учетом своих интересов и технологических возможностей.
Суммарный фонд материального поощрения зависит от результатов работы системы в целом. Центр может назначать ck исходя из очевидного
т
ограничения ^ ck & lt- c (x). Пусть выполнены усло-
k=1
вия благожелательности агента по отношению к центру. Они заключаются в том, что если максимальный выигрыш k-го агента достигается как при плане, назначаемом центром, так и при некоторых других вариантах планов xk*, то агент предпочтет план центра xk.
Необходимым и достаточным условием принадлежности выбранного плана к согласованным (xeS) является соотношение
Vk: EHk (xk) & gt- max EHk (xi*).
xi eXk
Следовательно, условия согласованного планирования будут иметь вид:
m
EHk (xk)+ck & gt- maxEHk (xk*)& gt- c (x) -Zck & gt-0.
~ -V '- '-
k=1
k=1
k=1
Поведение центра
Итеративный процесс планирования может быть представлен следующей схемой:
1) центр по исходной и дополнительной информации, сообщенной на Л-м шаге каждым к-м агентом, рассчитывает вариант плана х (Л)=|хк (Л)} и размер фонда материального поощрения с (Л)=|ск (Л)} за принятие агентами данного варианта в качестве плана. Центр сообщает агентам значения |хк (Л)} и |ск (Л)}-
2) агент выбирает и сообщает центру наилучший для себя план хк (Л)*. Примем, что на каждом Л-м шаге выполняется гипотеза о локально-оптимальном поведении агента-
3) если хк (Л)*Фхк (Л), то агент по запросу центра сообщает дополнительную информацию, т. е. осуществляется переход к первому шагу данной схемы. В случае совпадения хкЛ)*=хкЛ), процедура планирования заканчивается. Алгоритм определения плана будет зависеть от
степени информированности центра. Рассмотрим три его варианта.
Вариант 1. Полная информированность центра о локальных ограничениях агентов и их целевых функциях. Таким образом, центр имеет исходную информацию:
/(х), х), Ь, X, X*, тах Ерк (хк).
Этому варианту можно сопоставить следующий алгоритм определения плана.
1. На основании исходной информации центр может рассчитать план либо путем решения задачи ОП (х (Л)=х°), либо задачи ОСП (х (Л)=х& quot-). Т. к. рассматриваемая процедура является итеративной, то центр на Л-м шаге процедуры планирования имеет вектор значений планов, выбранных агентами за предыдущие (Л-1) шагов: {х*(1), х*(2),…, х*(к-1)}, где х*(МхЛ.
2. На каждом шаге центр по дополнительной информации корректирует предлагаемое агентом значение плана производственной программы и размера поощрения:
+ ЖхкА-1) — Хк*(А -1)),
+ а (птах Е% (Х& quot-)*) — Е% (х* -1))),
«(А) _ «(А-1) «к _ «к
с (А) _ с (А-1) ск _ ск
где, а и в — коэффициенты акселерации, выбираемые из соображений, имеющих, как правило, неформальный характер, хотя можно определить правило их изменения.
3. На каждом шаге агент выбирает наилучшую стратегию путем тах{тахЕрк (хкА)*), Ерк (хк (& quot-'-)}
и принимает один из вариантов плана: х (Л)* или хк (Л)
4. Если хк (Л)*Фхк (Л), то процедура повторяется с п. 2, если хк (Л)*=хк (Л)) процедура заканчивается утверждением плана.
Сходимость предложенной схемы зависит от вида решаемой задачи.
• Решается задача ОП. Пусть xkh) iSk, а также XnS0, тогда Ещ («кА)) & lt- max Ещ (хк (А)*). Так как
max{max Ещ (xf)*), Ещ (xf))} _ max Ещ ()*),
«еХк xi «?к
то xk (h)*^xk (h) и требуемое число шагов процедуры планирования h& gt-1. Сходимость процедуры будет обеспечена путем корректировки величины c (h) по правилу: c (h)(x)=c (h-1)(x)+^(c (h-1)(x (h)*))-c (h-1)(x (h)), где Y& gt-0, что означает уступку выигрыша центра в пользу агента для обеспечения xeS.
• Пусть x (h)eSk и XnS=0 (центр не учитывает интересы агентов). Рассматриваемая процедура планирования не сходится к x (h). Доказательство очевидно.
• Если xkh) eSt и XnS*0, то
Ещ («Г) & gt- maxЕщ («Г),
«. ?еХ,
тогда из условия благожелательности агента к центру следует, что
max{max Ещ («f)*), Ещ («f))} _ niax Ещ («f)*).
«еХк «i «??к
Следовательно, x (h)Vx (h) и процедура планирования сходится за один шаг, т. е. Л=1.
Вариант 2. Полная информированность центра о целевых функциях агента и неполной информированности о их локальных ограничениях, т. е. о множествах Xk. Пусть центр имеет исходную информацию: f («), G («), b, max Ещ («к). В этом случае можно рассмотреть следующую итеративную процедуру, использующую первую схему блочного программирования Полтеровича:
1. На h-м шаге центр получает дополнительную информацию от агентов о предлагаемых ими напряженных планах x (h)*=|xkh)*|. Центр, используя набор |x (1)*, x (2)*,^, x (h)*|, аппроксимирует множество X, используя гипотезу о его выпуклости:
А А
«(А) _ |» | «_ X)*, aj & gt- 0, X «, _ 1 j
2. Центр решает на каждом шаге либо задачу ОП: fx)^max, G (x)& lt-b, xeX (h), либо задачу ОСП, т. е. задачу ОП при дополнительных ограничениях, причем переменными являются как xk, так и ck, к=1,т
Ещ («кА)) + скА) & gt- maxЕщ («кА)*),
с («)-X с,-ХХкj & gt- о,
к _1 j _ 2 к _1
(6)
где 8(Р — планируемый размер дополнительного фонда материального поощрения, назначаемый центром агентам на ]-м шаге вместе с планом хки. Его величина определяется как & lt-5к0'-)=(рк'-И), хк ('-Н)), где р^ак1−1 gradFx (Xkt'--1), Уk (j-1)), к=1& quot-т, —
градиент функции Лагранжа, которая для задачи ОСП имеет вид:
^ (х, у) = / (х) -? х) — Ъ,] +
+Х у. +к
к =1
с — тах ЕФк (х*)
+Уп+т=1 С (х)-X С -ХХ5^
к=1 у=2 к=1
Для задачи ОП функция Лагранжа имеет тот же вид, но уп+т+1=0. Путем решения этой задачи центр получает значения x (h), с (Л), 5{Л) и p (h)=grad. Fx (x (h), y (h)), где (х (Л), у (Л)) — седловая точка функции Лагранжа на множестве Х (Л). аЛ)& gt-0 подбирается из условия обеспечения расходов центра на стимулирование агентов за счет роста величины с (х). Причем предполагается, что & lt-§^сх (х (Л)), х (Л)-х (Л-1))-(с (Л)-с (Л-1))>-0, т. е. на каждом шаге фонда поощрения должно хватать для стимулирования агентов за выбор напряженного плана и (•) — операция скалярного произведения векторов. Так как
& lt-б (А%а^х (х (АУ & gt-), х (А& gt- - х1& quot--1)) + (с*5 — с& quot- -1)) & lt- & lt-<-§ гаёсх (х (А)), х (А) — х (А-1)),
то
б (А) & lt--
& lt-Егаё^х (х (АV (АV (А} - х)
& lt-Егаёсх (х (АV (А>- - х (А-1)) — (с (А& gt- - с (А-1))'-
Значения х (Л), с (Л), 5Л), р (Л) центр сообщает активным элементам. 3. По своей целевой функции
Еу, (х!А)*) +
скА)(хкА)) + х (А)* = х (А) и хА» Е^к
7=2 +
0 х (А)* * х (А) и х U, хк * хк и х& gt-
ДА)*

(А)
5 '- & gt- 0 к& gt- & lt- о
агенты в соответствии с гипотезой о локально-оптимальном поведении выбирают наилучшую для себя ситуацию:
тах Ефк (хГ) — Еу, (х (А& gt-'-) + с/1) + Х5
тах
7=2
Еук (хГ) + скА& gt- + & gt- +& lt-РА>-, х (А"- -& gt-)
7=1
Для задачи ОП
?А) = {х | О (х (А& gt-) & gt- Ъ, /(х (А& gt-) & gt- /(хк1)*)}, а для задачи ОСП
'-х | О (х (А)) & gt- Ъ,
?(А & gt- =
ЕУк (хк)+ ск & gt- тахЕУк (хк (А^
Ч еХ1
(п, А т А
?с (х (А))-]ТскА & gt- -XXX 5А& gt-
V ,=1 7 =2 к=1
/(х (А)) & gt- /(х (А'-
& gt- о,
здесь х (Л)* - план, выбираемый агентом на Л-м шаге, х (Л)*еЬ (Л) — напряженный план, предлагаемый агентом центру на Л шаге-
ркА) & gt- 0 при хкА)* Е ?(А& gt-
{?к4 & lt- 0 при хкА)* е Х (А
4. Агенты сообщают центру свои наилучшие стратегии. Если хЦ, г*хЦ,), х^еХ^, то центр корректирует свое решение по схеме, описанной в п. 2. Если х^еЬ^, то центр обновляет информацию, расширяет множество Х (Л)сХ (Л+1) и вычисляет х (Л+1), с (Л+1), 5(Л+1), р (Л+1). Если хк,)*=хк,), то это означает, что
к
Еу (хкА& gt-) + скА& gt- + Х5А) & gt-
7=2
к
& gt- Еук (хкА'-*) + с (А+1) + Х%А) +& lt-РА>-, хкА>- - хкА& gt-).
7=1
Так как
Еук (хкА)*) + с& lt-А+1) & gt- Еук (х (А'-*) + ск (А'- & gt- гпахЕу (хк^ О, то & lt-ркЛ), хкЛ)*- хкЛ))& lt-0 для всех к-х агентов, т. е. хкА) ^ хкА+1), gradСx (хкА)) * 0, вга^х (хк^))0. Поэтому
а^А) * 0 и ^га^ (хкА)), xcк, — хк& quot-))& lt- 0.
Следовательно, точка (х^у^) оказывается сед-ловой точкой Лагранжа в задаче ОП или ОСП, и значение х,(Л)*=х ((Л) является соответственно оптимальным планом или оптимальным согласованным планом. Интерактивная процедура заканчивается.
Предположим, что условия образования фонда материального стимулирования таковы, что для любого хеХ выполняется неравенство |gradcx (x)|& gt-0, где • - длина вектора. Тогда величина фондов материального поощрения больше расходов на расширение множества Х (Л), поэтому в этом случае допустимое множество
т, А т
{х | О (х (А& gt- Ъ- с (х (А& gt-) — ХХскА) -XXXX& gt- 0-
к=1 7=2 к=1
Еук (хкА)*) + с (А) & gt- (гпах Еу (х^)} п Х (А) (7)
с ростом множества Х (Л) монотонно не сужается.
Достаточным условием сходимости описанного итеративного процесса является выполнение условия (6). Поскольку х^еБь, то
Еук (хкА)) + скА) & gt- гпахЕук (х*)4). Из соотношения
скА+1) = скА) + & lt-gradСx (хкА +1)), х (А +1) — х (А})
следует неравенство
. -(А+ «(к +1) & gt- ту / ЛА К ^(А)
Еук (хкА^) + скк+1) & gt- Еу4(хкА+ ск (А'- & gt- гпах^(х^ & gt-)
для х (Л)*еЬ (Л). Согласно условию алгоритма блочного программирования & lt-ркЛ), х ((Л)*-х ((Л))>-0 для всех х (Л)*еЬ (Л). Отсюда следует, что
т
А-1
Ещ (+ СГ + Cpkh),-xkh)»
j-2
h
& gt- Ещ ()) + ckh) J
j-2
Поэтому при решении задачи ОСП агент всегда будет выбирать x (h)*eL (h).
Следовательно, на каждом h-м шаге агенты формируют предложения для (Л+1)-го шага в виде значения напряженного плана x (h)*eL (h), который они могли бы реализовать. В силу условий (6) и (7) новое множество X (h+1) будет расширяться по сравнению с множеством X (h). При этом будут выполняться ограничения по фонду материального поощрения и условия совершенного согласования. Поскольку X (1)cX (2)c… cX (h)c… cX, то допустимые множества в задаче ОСП не убывают. За счет расширения допустимого множества значений f (x (h)) для каждой задачи ОСП будет только возрастать. Поэтому последовательность fx (1))fix (2)),… ,/(x (h)),… монотонно не убывает и в силу компактности множества X имеет предел/, т. е.
lim f (x (h)) = f * и f * = f (xOc).
Можно показать, что если решается задача ОП и нарушено условие совершенного согласования, то xkh)*^xkh) и xkh)*gL (h). Следовательно, xkh) t=xkh+1), и множество X (h) не расширяется в силу отсутствия у агентов стимулов отыскивать резервы для принятия напряженных планов, и процедура итеративного планирования закончится, не достигнув x°.
Вариант 3. Полная информированность центра об ограничениях и неполной информированности о целевых функциях fx), E%(xk). Центр имеет исходную информацию: G (x), b, X, Xk. То есть центр имеет полную математическую модель системы и ему не надо затрачивать усилия на идентификацию технологического множества системы. Но центру не известны мотивы и поведение агентов при выборе ими плановых заданий.
В этом случае можно рассмотреть любой итерационный алгоритм, например, использующий релаксационную схему условного градиента.
1. Центр на каждом шаге получает дополнительную информацию:
gradE^(x}h-1)*), gradfxk (xf-1)*), x (h-1)*Mc (h-1)*.
2. Центр на каждом Л-м шаге в точке x (h+1)* выбирает направление поиска на основе решения задачи ОП
& lt-gradfx (x (h-1)*), x — x (h -1)* & gt- i max, G (x) & gt- b, x e X (h-1)
или задачи ОСП с учетом условий согласования и ограничения по фонду материального поощ-
m
рения X ck ^ c (x). В последнем случае в задачу
k=1
оптимизации вводится новая переменная ck& gt-0.
Центр сообщает агентам значение плана х (Л) и размер планируемого поощрения с (л).
3. Агент по направлению поиска на каждом шаге выбирает наилучший для себя шаг вкЛ), решая в соответствии с гипотезой о локально-оптимальном поведении задачу:
Ещ [ хкА)* +вк (х!& quot-"- - хк& quot--1)*)] + +[ск+вк (ск& quot-"- - С& quot--1)*)]тах.
4. По величине шага вкЛ) агент определяет план хкЛ)*
h)* = x (h-1)* xk _ xk
+ ?k (h}(xkh) — x (h-1)*),
*k — ,*(k-1) +? (ck (h) — cf -1)*),
c. — c
(h)*
который он обязан выполнить за поощрение с, и сообщает его величину центру. 5. Если х (Л)*"хкЛ), то центр заканчивает процесс планирования, в противном случае центр запрашивает у агентов дополнительную информацию, т. е. осуществляет переход к п. 1 данной схемы.
Поведение агента
Как было показано выше, при разработке производственной программы центр использует приближенное описание множества X производственных возможностей агентов. Агент, обладая более детализированной информацией, может при создании центром более привлекательных условий ик путем решения задачи (5) определять для себя такой вектор хкЛ), который позволяет расширить множество ХкЛ) представлений центра о его возможностях, Л — шаг итерационного процесса. В данном случае вектор хкЛ) можно рассматривать как вектор способов действия.
Обозначим через сок=|ю (л), Л=1,Я}еАк вектор параметров состояния, определяющий значения вектора действий xkЛ)=|xkЛ), ?е[1,тк]}еХкЛ). Можно считать, что этот вектор описывает знание агентом возможностей контролируемого им объекта управления. Здесь Ак — множество возможных значений вектора состояния. Будем считать, что агент обладает способностями, знаниями, которые гарантируют существование Тк: Ак^ХкЛ).
Конструктивные возможности технологических узлов и доступный агенту уровень знаний делают справедливым предположение о существовании для -го агента множества предельных значений вектора ок:
Ok — {Ok |Ok (xk), xk eXt (tt& gt-k), & lt-

Будем предполагать, что агент за счет своих креативных способностей, способности к самообучению и поиску новой информации при соответствующем стимулирующем воздействии центра способен определять такие состояния со^еА и юк2) бАк, что возможно юк2)^юк1), где символ ^ означает «более значимо» и при этом Xk1))(®k1)feXk (2)(fflk (2)). Следовательно, существует такая последовательность сок1], ак2), акЪ),^, что
limо ()(xt J (®k))) = O*. То есть агент путем изучения объекта управления способен определить его предельные возможности для достижения желаемого для себя состояния. Последовательность w^'-w^wf,… будем называть последовательностью вскрытия резервов технологического узла за счет лучшего обслуживания и управления им агентом.
Такая способность агента формировать расширяющееся множество способов действия позволяет определить следующие свойства целевой функции агента и областей достижимости:
VwfVf Е At, wk2) ^ w?
X» (wf) с X& lt-2) (wk2)) ^ E% (xf) & gt- Ey (x (1)). (8)
Условие (8) означает, что поведение агента при выполнении принципа рациональности соответствует закону повышающихся потребностей, который в литературе по психологии поведения определяет мотивированность и целеустремленность агента.
Выработка решения при таком подходе заключается в реализации совокупности последовательных процедур, предназначенных для поиска промежуточных решений, на основании которых агент уточняет свои возможности и формирует окончательное решение. Полный цикл его формирования k-м агентом состоит в выполнении следующих шагов на этапе h:
1. Формирование множеств Ak и Xkh) на основе знаний, опыта, интуиции и располагаемой информации о параметрах состояния wkh). Просмотр множества Ak и формирование точки
OkA)* = {okA)* |okA)*(Xk (A)), xf& gt- eXk (hWW& gt- ЕA}.
Проверка, существует ли xkh)* такое, что oik)(xikh))*)=oik)*. Если да, то x (kh)* - это компромиссное решение, а okh)* - прогнозируемая ситуация, в противном случае переход к п. 2.
2. Решение задачи поиска потенциально-предпочтительного набора действий xkh)*EXkh)(wk (h)), позволяющего сформировать вектор okh) предельных значений критериев при использовании имеющегося на данный момент знания о правиле Tkh) и структуре множества Ak. Так как компоненты okh), i=1,N порознь достижимы, а вместе нет, то делается попытка найти компромиссное решение. Если агент не согласен попытаться найти компромиссное решение за счет компенсаторных уступок по каждому критерию, которые несколько хуже решения okh), то переход к п. 3, иначе к п. 5.
3. Исследование направлений возможного расширения множества A, организация процедур поиска новой информации (знания) о wikh) EAk и правиле У A^Xf.
4. Если расширение множества Ak возможно, то переход к п. 1, иначе фиксация ситуации, что компромиссное решение не может быть найдено при выбранном векторе okh)*.
6.
Получение информации, достаточной для определения вектора минимально предпочтительных значений критериев о[(р)& lt-о[к)*. Выполнение процедуры поиска максимально-предпочтительной точки в пространстве критериев по направлению предпочтения окЛ), о (Л)*, определение вектора юкЛ)*еЛк и х Г* еХ (Л)(а{к)*). Если полученное значение для х Г*, о ((,)* принимается как компромиссное решение, то процедура останавливается, в противном случае переход к п. 8.
Для ограничений на о[Л) определяется приоритетная координата ?0е[1Д], по которой делается
расширение множеств Ak
и Xkh)
так, чтобы
окЛ)(хкЛ))=окЛ))+АкЛ), где А, — минимально возможное улучшение, которое является значимым для агента и определяется по его высказываниям о «гибкости» ограничения на основе выполнения процедур поиска дополнительной информации. Переход к п. 1. Легко видеть, что в данном случае возможно информационное управление со стороны центра. Оно состоит в предоставлении управляемому субъекту определенной информации (информационная картина), ориентируясь на которую агент, имея возможность доступа к собственным источникам информации, выбирает линию своего поведения при формировании встречной информации.
Результаты
Полученные теоретические результаты использованы при выполнении работ по внедрению информационных технологий в задачах управления производством хладонов и фторопластов. Участие человека на всех стадиях и уровнях управления этого производства делает зависимой эффективность его функционирования от поведения операторов, технологов, обслуживающего персонала при реализации производственной программы. Более того, ряд особенностей объекта управления потребовали от руководства распределения точек принятия решений так, что подсистемы нижних уровней получают определенную автономию в пределах своей компетенции при принятии решений о ведении технологического процесса. Производственный персонал использует такую схему для принятия варианта решения, оптимизирующую их локальную функцию цели, в общем случае не совпадающую с функцией цели системы, что подтверждается существенным различием в показателях результатов смен.
Предложенная методология построения системы управления эволюцией ХТС реализована при построении производственной программы для производства фторопластов. Соответствующие результаты приведены в табл. 1, 2. В табл. 1 показано изменение показателей производства и представлений персонала в процессе согласования и оптимизации. В табл. 2 приведены данные, отображающие динамику показателей качества в процессе согласования.
8
Таблица 1. Динамика показателей производства в процессе
согласованной оптимизации Table 1. Dynamics of production indices in consistent optimization
Итерации Iterations 2 3 4 5 6
Показатели
Indices
Прибыль/Benefit 1,037 1,054 1,11 1,12 1,192
Себестоимость/First-cost 0,98 0,96 0,955 0,94 0,938
Выпуск продукции/Production 1,034 1,052 1,072 1,082 1,089
Зарплата/Salary 1 1,054 1,098 1,1 1,12 1,24
Целевая функция/Target goods 0,97 0,92 0,945 0,967 0,98
E& lt-P 0,95 1,02 1,12 1,23 1,26
EE 1 1 0,99 0,98 0,97
Таблица 2. Динамика показателей качества и некоторых составляющих себестоимости в процессе
Table 2. Dynamics of quality indices and some components of first-cost in the process
Итерации Iterations Показатели Indices 1 2 3 4 5 6
Доля Х-22/Х-22 part 89,2 93,3 94,2 94,6 94,8 95
Доля Х-21/Х-21 part 8 5,3 4,8 3,8 3,5 3,2
Доля Х-23/Х-23 part 2,8 1,4 1 1,1 1,7 1,8
Потери HF/HF losses 0,98 0,94 0,91 0,89 0,889
Расход хлороформа Chloroform consumption 0,97 0,92 0,89 0,86 0,858
Сурьма/Stibium 0,95 0,92 0,91 0,9 0,893
Холод «-15"/Cold «-15» 1
Холод «-35» /Cold «-35» 1 0,98 0,97 0,96 0,96 0,96
Пар/Vapor 1,1 1,12 1,12 1,13 1,13
Общие затраты/General costs 0,93 0,89 0,87 0,86 0,857
Зарплата/Salary 1,12 1,15 1,17 1,2 1,21
E& lt-p 1,03 1,1 1,16 1,19 1,2
EE 0,99 0,94 0,91 0,89 0,8
Приведенные данные показывают, что двухуровневая система согласованной оптимизации про-
изводственной программы, основанная на стимулировании производственного персонала путем учета их интересов и ожиданий, позволила реализовать концепцию прогрессивной эволюции производства. Ее внедрение на производстве хладонов и фторопластов позволила увеличить выпуск продукции до 5−7% в год и снизить технологическую составляющую себестоимости на 6−8%.
Заключение
1. Исследована сходимость итеративной процедуры согласованной оптимизации в системе, состоящей из центра и т агентов, для трех вариантов информированности центра о компонентах модели выбора агентов.
2. Для случая полной информированности центра показано, что решение задачи ОСП будет реализовано агентами, если найдено стимулирующее воздействие еЦ& quot-, при котором
Еу*(х*А)) & gt- тахЕ%(х*(А)*).
3. Для случая неполной информированности центра сходимость к оптимальному решению будет обеспечена путем дополнительного стимулирования агентов за более полное раскрытие ими своих возможностей. Приведена итеративная процедура, использующая идею алгоритма блочного программирования Полтеровича. Показано, что достаточным условием ее сходимости будет условие (6'-.
4. Для случая неполной информированности центра о предпочтениях агентов показано, что решение может быть получено при использовании итерационного алгоритма, использующего релаксационную схему условного градиента.
5. Описано поведение агента при управляющем воздействии со стороны центра ик={хк, ек, 8к]. Показано, что последовательность сообщений *-м агентом о своих резервах будет сходиться к предельному значению при выполнении условия (8).
СПИСОК ЛИТЕРАТУРЫ
1. Заде Л. А. Основы нового подхода к анализу сложных процессов принятия решений // Математика сегодня. — М.: Знание, 1978. — С. 5−40.
2. Беллман Р., Заде Л. Принятие решений в расплывчатых условиях // Вопросы анализа и процедуры принятия решений / пер. с англ. — М.: Мир, 1976. — С. 172−215.
3. Бурков В. Н. Основы математической теории активных систем. — М.: Наука, 1977. — 255 с.
4. Бурков В. Н., Новиков Д. А. Теория активных систем: состояние и перспективы. — М.: СИНТЕГ, 1999. — 128 с.
5. Бурков В. Н., Коргин Н. А., Новиков Д. А. Введение в теорию управления организационными системами / под ред. Д. А. Новикова. — М.: Книжный дом «ЛИБРОКОМ», 2009. — 264 с.
6. Бурков В. Н., Кондратьев В. В. Механизмы функционирования организационных систем. — М.: Наука, 1981. — 384 с.
7. Новиков Д. А. Сетевые структуры и организационные системы. — М.: ИПУ РАН, 2003. — 124 с.
8. Чхартишвили А. Г. Теоретико-игровые модели информационного управления. — М.: ЗАО «ПМСОФТ», 2004. — 227 с.
9. Кузнецов В. Н. Согласование и оптимизация в иерархических системах с активными элементами. — М.: Институт проблем управления, 1996. — 132 с.
10. Kandori M. Social norms and community enforcement // Review of Economics Studies. -1992. — V. 59. — P. 61−80.
11. Tversky А., Kahneman D. Causal schemas in judgments under uncertainty / in М. Fishbein (Ed.). Progress in social psychology. — Hillsdale, N.J.: Erlbaum, 1980. — P. 45−82.
12. Hiam A. Motivating and rewarding employees. — Massachusetts: Adams Media Corporation, 2001. — 320 p.
13. Slovic Р., Fischhoff В., Lichtenstein S. Facts vs. fears: Understanding perceived risk / in R. Schwing, W.A. Albers, Jr. (Eds.).
Societal risk assessment: How safe is safe enough? — New York: Plenum, 1980. — 461 p.
14. Браверман Э. М. Математические модели планирования и управления в экономических системах. — М.: Наука, 1976. -368 с.
15. Новиков Д. А. Методология управления. — М.: Либроком, 2012. — 128 с.
16. Новиков Д. А., Чхартишвили А. Г. Рефлексия и управление: математические модели. — М.: Изд-во физико-математической литературы, 2013. — 412 с.
17. Binmore K. Game theory and the social contract. — Massachusetts: MIT Press, 1998. — 589 p.
18. Орлов А. И. Теория принятия решений. — М.: Экзамен, 2006. -573 с.
19. Виноградов Г. П., Кузнецов В. Н. Моделирование поведения агента с учетом субъективных представлений о ситуации выбора // Искусственный интеллект и принятие решений. -2011.- № 3. — С. 58−72.
20. Виноградов Г. П. Модель поведения с учетом субъективных представлений о целеустремленной ситуации состояния // Вестник Ростовского государственного университета путей сообщения. — 2011. — № 3 (43). — С. 51−58.
21. Виноградов Г. П. Модель принятия решений с учетом субъективных представлений о ситуации выбора // Обозрение прикладной и промышленной математики. — 2011. — № 6. -С. 61−64.
Поступила 23. 06. 2014 г.
UDC 330. 115
INTERACTIVE METHODS FOR OPTIMIZING THE MANAGEMENT OF A COHERENT EVOLUTION OF THE ORGANIZATIONAL AND TECHNOLOGICAL SYSTEM
Gennady P. Vinogradov,
Dr. Sc., Tver State Technical University, 12, Marshal Konev street, Tver, 170 023,
Russia. E-mail: wgp272ng@mail. ru
The relevance of the work is caused by the fact that the information technology effectiveness in the system of controlling evolution of organizational-technological system in the conditions of uncertainty and risk depends first of all on the way the people using the technologies identify and perceive objective evidences of the emerging situations, build assessments, form new knowledge, develop and coordinate behaviors.
The main aim of the research is to justify the possibility of using interactive, iterative procedures in coordinated planning tasks for identifying technological reserves and ensuring progressive evolution of organizational and technological systems by maximum complete use of production staff creative potential.
Research methods: general methodology and methods of system analysis, simulation and modeling, the methods of theories: fuzzy sets, active systems, decision making, artificial intelligence, fuzzy systems and fuzzy logic, game theory.
Results. The author has investigated the convergence of interactive procedure of the agreed optimization in the task of controlling evolution of organizational-technological system, consisting of a centre and m agents at different types of center awareness on agent abilities. In the case of complete centre awareness it was shown that the solution to the problem of optimal coordinated planning will be implemented by the agents, if stimulus and the plan are found under which the specific value of the purposeful state situation will exceed the value of the same indicator for all other variants. For the case of incomplete centre awareness it was shown that the convergence to the optimal solution will be provided by additional agent stimulating for a more complete disclosure of their capabilities. The paper introduces the iterative procedure using the idea of Polterovich block programming algorithm. The author formulated the condition for its convergence. For the case of center incomplete awareness on agent preferences it was shown that the solution can be obtained applying an iterative algorithm which uses a relaxation scheme of conditional gradient. The paper introduces the conditions under which one can build the procedure of the interactive information exchange between the center and the agents that guarantee the convergence of the solution of coordinated optimization task. The author carried out the experimental validation of the approach proposed in the development of the production program for manufacturing refrigerants and fluoropolymers.
Key words:
Active system, intelligent agent, consistent optimization, decision making, interactive cooperation.
REFERENCES
1. Zade L.A. Osnovy novogo podkhoda k analizu slozhnykh protses-sov prinyatiya resheny [The bases of a new approach to analyze complex decision making processes]. Matematika segodnya [Mathematics today]. Moscow, Znanie Publ., 1978. pp. 5−40.
2. Bellman R., Zade L. Prinyatie resheny v rasplyvchatykh usloviy-akh [Decision making in fuzzy conditions]. Voprosy analiza i prot-seduryprinyatiya resheny [Issues of analysis and decision making procedures]. Translated from English. Moscow, Mir Publ., 1976. pp. 172−215.
3. Burkov V.N. Osnovy matematicheskoy teorii aktivnykh sistem [The foundations of the mathematical theory of active systems]. Moscow, Nauka Publ., 1977. 255 p.
4. Burkov V.N., Novikov D.F. Teoriya aktivnykh sistem: sostoyanie i perspektivy [The theory of active systems: status and prospects]. Moscow, Sinteg Publ., 1999. 128 p.
5. Burkov V.N., Korgin N.A., Novikov D.A. Vvedenie v teoriyu upravleniya organizatsionnymi sistemami [Introduction to the theory of control of organizational systems]. Ed. by D.A. Novikov. Moscow, Librokom Publ., 2009. 264 p.
6. Burkov V.N., Kondratev V.V. Mekhanizmy funktsionirovaniya organizatsionnykh sistem [Mechanisms of organizational system functioning]. Moscow, Nauka Publ., 1981. 384 p.
7. Novikov D.A. Setevye struktury i organizatsionnye sistemy [Network structure and organizational systems]. Moscow, IPU RAN Publ., 2003. 124 p.
8. Chkhartishvili A.G. Teoretiko-igrovye modeli informatsionnogo upravleniya [Game-theoretic models of information management]. Moscow, Zao «Pmsoft» Publ., 2004. 227 p.
9. Kuznetsov V.N. Soglasovanie i optimizatsiya v ierarkhicheskikh sistemakh s aktivnymi elementami [Coordination and optimization in hierarchical systems with active elements]. Moscow, Institut problem upravleniya Publ., 1996. 132 p.
10. Kandori M. Social norms and community enforcement. Review of Economics Studies, 1992, vol. 59, pp. 61−80.
11. Tversky A., Kahneman D. Causal schemas in judgments under uncertainty. In M. Fishbein (Ed.). Progress in social psychology. Hillsdale, N.J.: Erlbaum, 1980. pp. 45−82.
12. Hiam A. Motivating and rewarding employees. Massachusetts, Adams Media Corporation, 2001. 320 p.
13. Slovic P., Fischhoff B., Lichtenstein S. Facts vs. fears: Understanding perceived risk. In R. Schwing, W.A. Albers, Jr. (Eds.). Societal risk assessment: How safe is safe enough? New York, Plenum, 1980. 461 p.
14. Braverman E.M. Matematicheskie modeli planirovaniya i upra-vleniya v ekonomicheskikh sistemakh [Mathematical models of planning and control in economic systems]. Moscow, Nauka Publ., 1976. 368 p.
15. Novikov D.A. Metodologiya upravleniya [Management methodology]. Moscow, Librokom Publ., 2012. 128 p.
16. Novikov D.A., Chkhartishvili A.G. Refleksiya i upravlenie: matematicheskie modeli [Reflection and management: mathematical models]. Moscow, Izd-vo fiziko-matematicheskoy literatury, 2013. 412 p.
17. Binmore K. Game theory and the social contract. Massachusetts, MIT Press, 1998. 589 p.
18. Orlov A.I. Teoriya prinyatiya resheny [The decision making theory]. Moscow, Ekzamen Publ., 2006. 573 p.
19. Vinogradov G.P., Kuznetsov V.N. Modelirovanie povedeniya agenta s uchetom subektivnykh predstavleny o situatsii vybora [Modeling the behavior of an agent with regard to subjective views on the situation of choice]. Iskusstvenny intellekt i prinyatie resheny, 2011, no. 3, pp. 58−72.
20. Vinogradov G.P. Model povedeniya s uchetom subektivnykh predstavleny o tseleustremlennoy situatsii sostoyaniya [The behavior model with regard to subjective notions of purposeful situation status]. Vestnik rostovskogo gosudarstvennogo universite-ta putey soobshcheniya, 2011, no. 3 (43), pp. 51−58.
21. Vinogradov G.P. Model prinyatiya resheny s uchetom subektiv-nykh predstavleny o situatsii vybora [The model of decision making with regard to subjective views on the situation of choice]. Obozrenie prikladnoy i promyshlennoy matematiki, 2011, no. 6, pp. 61−64.
Received: 23 June 2014.

ПоказатьСвернуть
Заполнить форму текущей работой