Погрешности моделирования высоконагруженных систем в GPSS World

Тип работы:
Реферат
Предмет:
ТЕХНИЧЕСКИЕ НАУКИ


Узнать стоимость

Детальная информация о работе

Выдержка из работы

4
КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 001. 891. 573- 519. 872
ПОГРЕШНОСТИ МОДЕЛИРОВАНИЯ ВЫСОКОНАГРУЖЕННЫХ
СИСТЕМ В GPSS WORLD Т.И. Алиев
Излагаются результаты исследования влияния программных генераторов псевдослучайных величин на точность моделирования высоконагруженных систем массового обслуживания в системе имитационного моделирования GPSS World. Показано, что при некоторых сочетаниях генераторов, называемых проблемными, погрешности определения среднего времени ожидания заявок в высоконагруженной системе могут достигать десятков процентов. Выполненный анализ проблемных сочетаний позволил выявить факторы, обусловливающие большие погрешности результатов моделирования.
Ключевые слова: имитационное моделирование, высоконагруженная система, генераторы псевдослучайных величин, погрешность моделирования, GPSS World.
Одной из наиболее апробированных и широко распространенных систем имитационного моделирования (СИМ) является GPSS (General Purpose Simulation System) и, в частности, реализованная в среде Microsoft Windows версия GPSS World [1], в которой используются программные генераторы равномерно распределенных в интервале (0−1) псевдослучайных величин. Последовательность формируемых в процессе моделирования значений псевдослучайных величин зависит от задаваемого в качестве параметра целочисленного начального значения, что позволяет говорить о множестве используемых в GPSS World генераторов случайных величин, которые будем обозначать как 1, 2, 3, … Кроме того, в GPSS World имеется более 20 библиотечных процедур для формирования случайных величин с заданными законами распределений, базирующихся на встроенных генераторах равномерно распределенных величин.
Полувековая история существования СИМ GPSS и ее широкое применение в различных областях сформировали мнение, что при достаточно большой и обоснованно выбранной длительности моделирования погрешности результатов имитационного моделирования обычно не превышают 3−5%. Однако при моделировании высоконагруженных систем массового обслуживания (СМО), загрузка которых р& gt-0,8, было выявлено, что при некоторых сочетаниях генераторов случайных величин, задаваемых в виде {N1- N2} (здесь N1 и N2 — номера генераторов, используемых для формирования значений интервалов между поступающими в систему заявками и длительностей обслуживания заявок соответственно), погрешность результатов моделирования может составлять 30% и более. При этом для других сочетаний генераторов эта погрешность при той же длительности моделирования, задаваемой числом прошедших через систему заявок, оказывается менее 3%.
Для выяснения обстоятельств, связанных с появлением такого эффекта, было проведено исследование генераторов псевдослучайных величин с целью оценки качества используемых в СИМ GPSS World генераторов и выявления причин, обусловливающих большую погрешность результатов моделирования при использовании некоторых сочетаний. Исследование проводилось в несколько этапов.
На первом этапе были выявлены так называемые проблемные сочетания генераторов, при использовании которых погрешность результатов моделирования оказывается значительной.
Для объяснения возникающей погрешности были протестированы проблемные встроенные генераторы равномерно распределенных псевдослучайных величин и библиотечные генераторы на соответствие декларируемым законам распределения [2].
Поскольку большая погрешность моделирования возникает только при использовании некоторых конкретных сочетаний генераторов, необходимо было выполнить корреляционный анализ соответствующих последовательностей случайных значений, рассчитать коэффициенты корреляции и сравнить эти коэффициенты для проблемных и непроблемных сочетаний генераторов случайных величин.
На последнем этапе была проанализирована зависимость результатов моделирования, а именно, среднего времени ожидания заявок, от длительности моделирования, задаваемого количеством заявок, прошедших через модель.
Для исследования погрешностей результатов имитационного моделирования и выявления проблемных сочетаний генераторов использовались вР88-модели одно- и многоканальных СМО типа М/М/1, М/в/1 и М/М/2, поддающиеся точному аналитическому расчету [2]. Варьируя загрузку систем от 0,1 до 0,9 и пропуская через каждую модель по 1 млн. заявок, было выявлено, что погрешность результа-
Введение
Описание экспериментов
тов моделирования лежит в приемлемых пределах (1−5%) для значений загрузки примерно до 0,7. Начиная со значения р& gt-0,8, при некоторых сочетаниях генераторов случайных величин погрешность начинала расти и составляла 10% и более, а при р=0,95 достигала 40%. При исследовании реальных систем (маршрутизаторов, коммутаторов, серверов в компьютерных сетях) наибольший интерес обычно представляют сведения о качестве функционирования системы при большой загрузке, что делает задачу обеспечения приемлемой точности в процессе имитационного моделирования весьма актуальной. В связи с этим все последующие эксперименты выполнялись для систем, загрузка которых составляла 0,9 и 0,95. Для указанных значений загрузки системы были выполнены более 10 тыс. экспериментов при различных сочетаниях генераторов с номерами от 1 до 100 и выявлены сочетания генераторов, при которых достигается наибольшая погрешность результатов моделирования. В процессе экспериментов было установлено, что погрешности моделирования зависят только от загрузки системы р=ХЬ и длительности моделирования, задаваемого количеством заявок, прошедших через систему, и не зависят от значений параметров загрузки — интенсивности поступления заявок X и средней длительности обслуживания заявок Ь. Кроме того, было установлено, что использование проблемных сочетаний генераторов случайных величин приводит к значительным погрешностям результатов моделирования для других, более сложных моделей, в частности, для многоканальных СМО и двухузловых сетей массового обслуживания (СеМО), при других законах распределений, использующих эти генераторы.
Проблемные сочетания генераторов
На модели М/М/1 с однородным потоком заявок и загрузкой р=0,9 было проведено 10 000 экспериментов с целью выявления всех проблемных сочетаний генераторов с номерами от 1 до 100. В каждом эксперименте через модель пропускался 1 млн. заявок. Относительная погрешность моделирования рассчитывалась для среднего времени ожидания заявок как =-*-100%, где м& gt- - значе-
М& gt-*
ние, полученное в процессе имитационного эксперимента- w* - точное значение, рассчитанное для СМО М/М/1. Для большинства сочетаний погрешность не превышала 5%. В то же время, как видно из табл. 1, для 40 сочетаний погрешность превысила 20% и для 128 сочетаний — 10%.
Погрешность
Проблемные сочетания генераторов
10−20%
{1−2}
{7−21}
{13−26}
{16−32}
{20−60}
{24−96}
{30−10}
{38−19}
{42−28}
{48−96}
{65−13}
{82−41}
{96−48}
{3−6}
{8−16}
{13−65}
{16−48}
{20−100}
{25−50}
{30−20}
{38−76}
{44−22}
{50−25}
{66−22}
{84−12}
{99−33}
{3−9}
{8−32}
{14−7}
{16−64}
{21−7}
{25−75}
{30−60}
{39−78}
{44−88}
{51−17}
{68−17}
{84−56}
{4−6}
{8−48}
{14−42}
{17−51}
{21−14}
{26−13}
{32−8}
{40−8}
{46−69}
{60−15}
{69−46}
{87−29}
{4−12} {9−3} {15−3} {17−68} {21−63} {27−9} {32−48} {40−10} {46−92} {60−20} {70−35} {88−44}
{5−15}
{10−30}
{15−5}
{18−6}
{22−44}
{27−54}
{33−22}
{40−80}
{47−94}
{60−30}
{72−24}
{92−46}
{6−3}
{11−77}
{15−10}
{19−57}
{22−66}
{28−56}
{33−66}
{41−82}
{48−8}
{63−9}
{75−15}
{93−31}
{6−18}
{12−4}
{15−45}
{20−5}
{24−48}
{29−87}
{33−99}
{42−6}
{48−16}
{63−21}
{76−38}
{94−47}
{7−14} {12−6} {16−8} {20−30} {24−72} {30−6} {36−12} {42−14} {48−24} {64−16} {80−40} {96−24}
{100−20} {100−50}
& gt-20%
{2−1}
{15−30}
{31−62}
{49−98}
{78−39}
{4−8}
{18−9}
{32−16}
{52−26}
{86−43}
{5−10} {20−10} {32−64} {54−27} {90−45}
{8−4}
{20−40}
{36−72}
{57−19}
{98−49}
{9−18} {10−5} {10−20}
{21−42} {24−12} {26−52}
{37−74} {40−20} {42−21}
{62−31} {64−32} {66−33}
{12−24} {14−28}
{28−14} {30−15}
{43−86} {45−90}
{72−36} {74−37}
Таблица 1. Проблемные сочетания генераторов
Анализ представленных результатов показывает, что наиболее проблемными являются сочетания генераторов, номера которых соотносятся как 1: 2, 1: 3, 2:1 или 3:1.
Большинство проблемных сочетаний генераторов были проверены также для СМО общего вида в/в/1, в частности, и/и/1 и многоканальных СМО. Для сравнения в табл. 2 представлены результаты имитационного моделирования при использовании различных сочетаний генераторов в СМО М/М/1, загрузка которой р=0,95, а длительность обслуживания Ь=9,5 единиц времени. В этом случае точное значение среднего времени ожидания ^=180,5 единиц.
Генераторы Время ожидания, ед. Погрешность, %
{2- 1} 114,4 -36,6
{2- 2} 173,6 -3,8
{2- 4} 155,8 -13,7
{20- 40} 111,8 -38,1
{40- 20} 113,2 -37,3
{110−40} 179,9 -0,3
{200−400} 136,5 -24,4
{999−40} 177,1 -1,9
{2000- 4000} 119,3 -33,9
Таблица 2. Погрешности моделирования СМО М/М/1
Как видно из табл. 2, для проблемных сочетаний генераторов случайных величин погрешность результатов моделирования достигала 40%, в то время как у непроблемных сочетаний {2- 2}, {110- 40} и {999- 40} при той же длительности моделирования погрешность не превышала 5%. Более того, использование одного и того же генератора с номером 2 {2- 2} для формирования значений интервалов между поступающими заявками и длительности обслуживания позволяет получить существенно более точный результат, чем использование этого же генератора в сочетании с другим генератором. Перестановка генераторов в сочетании с {10- 20} на {20- 10} незначительно изменяет погрешность моделирования.
Аналогичные эксперименты были выполнены для двухузловой разомкнутой экспоненциальной СеМО, в которой заявки последовательно проходят через узлы, загрузка которых р≠р2=0,95. Расчетные значения среднего времени ожидания составили в узлах ^1=^2=180,5 и в сети Ш=^1+^2=361 единиц. В табл. 3 представлены результаты имитационного моделирования при различных сочетаниях генераторов, задаваемых в виде {N1- N2- N3}, где N1, N2 и N3 — номера генераторов, используемых для формирования значений интервалов между поступающими в сеть заявками и длительностей обслуживания заявок в узлах 1 и 2 соответственно.
Сочетание генераторов Узел 1 Узел 2 Сеть
ед. %2, ед. 52, % Ш, ед. дЖ, %
{10- 20- 40} 121,1 -32,9 134,7 -25,39 255,72 -29,16
{20- 10- 40} 106,6 -41,0 122,0 -32,39 228,61 -36,67
{40- 20- 10} 113,2 -37,3 128,0 -29,11 241,13 -33,20
{21- 15- 719} 169,0 -6,4 170,7 -5,43 339,68 -5,91
{20- 10- 20} 172,7 -4,3 185,4 2,69 358,04 -0,82
{14- 28- 56} 110,4 -38,9 157,2 -12,90 267,58 -25,88
{28- 56- 14} 138,4 -23,3 134,2 -25,65 272,62 -24,48
{140- 280- 560} 124,4 -31,1 133,5 -26,06 257,88 -28,57
{280- 560- 140} 116,1 -35,7 128,7 -28,71 244,80 -32,19
Таблица 3. Погрешности моделирования двухузловой СеМО
Как видно из табл. 3, относительная погрешность (разброс) результатов моделирования для проблемных сочетаний генераторов составляет более 25% как для узловых, так и для сетевых характеристик. Большой разброс наблюдается также для такой важной характеристики, как максимальная длина очереди заявок. Так, например, максимальная длина очереди заявок в узлах 1 и 2 для сочетания {20- 10- 20} составляет 153 и 186 соответственно, а для проблемного сочетания {20- 10- 40} - 79 и 95, т. е. имеем почти двукратное отличие.
Тестирование генераторов
Генератор равномерно распределенных случайных величин вырабатывает базовую последовательность значений в интервале (0- 1), которая используется для формирования случайных величин, распределенных по другим законам и в других интервалах. Поскольку погрешность может появиться как на этапе генерации базовой последовательности, так и на этапе формирования экспоненциально распределенной величины, было проведено тестирование базовых последовательностей и последовательностей экспоненциально распределенных случайных величин.
Относительная погрешность математического ожидания случайных величин для генераторов, входящих в состав проблемных сочетаний, в большинстве случаев составляла более 0,1%, в то время как
для других генераторов — менее 0,1%. Этот результат справедлив как для базовых последовательностей, так и для последовательностей экспоненциально распределенных случайных величин.
Для базовой последовательности относительная погрешность среднеквадратического отклонения для всех исследованных генераторов, включая генераторы, входящие в состав проблемных сочетаний, составила менее 0,01%. Для последовательностей экспоненциально распределенных случайных величин эта погрешность оказалась больше 0,01%, а для генераторов, входящих в состав проблемных сочетаний, достигала значений 0,2% и более.
Результаты корреляционного анализа
Корреляционный анализ базовых последовательностей и последовательностей, экспоненциально распределенных случайных величин на выборке по 1 млн. значений каждого генератора, показал, что коэффициенты корреляций проблемных сочетаний генераторов случайных величин в 5−10 раз превышают значения коэффициентов корреляции непроблемных сочетаний, причем они принимают положительные значения, т. е. большему (меньшему) значению первого генератора соответствуют большие (меньшие) значения второго генератора. Это означает, что с большой вероятностью заявке, поступившей в систему с большим интервалом (сформированным первым генератором) от момента поступления предыдущей заявки, будет соответствовать (сформировано вторым генератором) большее время обслуживания, и, наоборот, заявке, поступившей в систему с небольшим интервалом от момента поступления предыдущей заявки, будет соответствовать маленькое время обслуживания. Вероятность же ситуации, когда заявке, поступившей в систему с маленьким интервалом, будет соответствовать большое время обслуживания, оказывается незначительной. Все это приводит к тому, что результаты имитационного моделирования, в частности, среднее время ожидания, оказываются существенно заниженными даже при достаточно длительном моделировании.
Анализ переходных процессов в модели
Для проблемных сочетаний генераторов с целью выяснения характера изменения среднего времени ожидания от длительности имитационного моделирования, задаваемого числом заявок, проходящих через моделируемую систему, были выполнены эксперименты, при которых через систему пропускалось до 100 млн. заявок, а в некоторых моделях до 200 млн. заявок. Изучение переходного процесса в СМО позволило установить, что даже при таком большом количестве заявок, пропущенных через систему, среднее время ожидания не достигало расчетного значения, а погрешность могла составлять до 10%. На рис. 1 представлены зависимости среднего времени ожидания заявок и относительной погрешности результатов имитационного моделирования от числа заявок, прошедших через имитационную модель СМО М/М/1 с загрузкой 0,95, для сочетания генераторов {20−10}.
л 200 й 180
о и В
& lt-и & amp-
о
160 140 120 100 80 1 60 § 40
& lt-и
И 20
к
а
ич
6
00 О & quot-Л 12
0 0
ич
0
ич
0 0 0
0 0 0 2
0 0 0
0 0 0 0 4
0 0 0 0
ич
0 0 0 0 6
о тыс. заявок 0 0 0
Время ожидания (модельное) — - ф- Погрешность-
-И- Время ожидания (расчетное значение)
Рис. 1. Проблемное сочетание генераторов {20- 10}
Из графика видно, что даже после прохождения через модель 100 млн заявок относительная погрешность составляет около 10%. Отметим, что коэффициент корреляции генераторов 20 и 10 положителен и равен 0,247.
0
к
а
о «
S
(D
а m
Заметим также, что использование широко применяемого на практике метода «срезов» для определения вхождения системы в стационарный режим может привести к ошибочным результатам. Например, как видно из графика, среднее время ожидания при пропускании 100 тыс., 250 тыс. и 500 тыс. заявок остается практически неизменным (отличие менее чем на 1%), откуда можно сделать вывод, что система вошла в стационарный (установившийся) режим и, следовательно, процесс моделирования может быть завершен. При этом погрешность результата моделирования оказывается более 40%.
Для сравнения на рис. 2 показана аналогичная зависимость для той же модели при использовании непроблемного сочетания генераторов {110- 40}, откуда видно, что установившийся режим в системе существует уже после пропускания 500 тыс. заявок, и погрешность результатов моделирования в дальнейшем не превышает 4%. Следует обратить внимание, что такой характер зависимости модельного времени ожидания по отношению к расчетному может быть объяснен тем, что коэффициент корреляции генераторов 110 и 40 — отрицательный и равен -0,176.
200,000 195,000 190,000 185,000 180,000 175,000 170,000 165,000 160,000 155,000 150,000
'- оооооооооооооооо тыс заявок 0
н (N m Tt «ч чо
• Время ожидания (модельное) — - Время ожидания (расчетное) Рис. 2. Непроблемное сочетание генераторов {110−40}
Для двухузловой разомкнутой СеМО на рис. 3 представлены зависимости относительных погрешностей среднего времени ожидания заявок в узлах и в сети в целом от количества заявок, прошедших через имитационную модель при использовании проблемного сочетания генераторов {20- 10- 40}. Из графика видно, что даже после пропускания через модель 200 млн заявок относительная погрешность результатов моделирования составляет около 10%.
45'-
40
35
§ 30 и
§ 25 f 20 § 15 10 5 0
1 10 40 80 120 160 200 млн. заявок ¦ Среднее время ожидания в узле 1- И Среднее время ожидания в узле 1-
* Суммарное время ожидания в сети
Рис. 3. Относительные погрешности для сочетания генераторов {20- 10- 40}
Заключение
Погрешность результатов моделирования высоконагруженных систем (р& gt-0,8) в системе имитационного моделирования на GPSS World при некоторых сочетаниях генераторов случайных величин, используемых для формирования значений интервалов между поступающими в систему заявками и длительностей обслуживания заявок, может оказаться значительной и достигать десятков процентов.
е р
m
А.А. Фильченков
Результаты многочисленных экспериментов позволили выявить, что наибольшая погрешность достигается для сочетаний генераторов, номера которых соотносятся как 1: 2, 1: 3, 2:1 и 3:1.
Выполненный корреляционный анализ показал, что коэффициенты корреляций проблемных сочетаний генераторов принимают положительные значения и по абсолютной величине в 5−10 раз превышают значения коэффициентов корреляции непроблемных сочетаний, что обусловливает значительные погрешности результатов моделирования высоконагруженных систем.
Анализ переходных процессов в моделях высоконагруженных систем при использовании проблемных сочетаний генераторов случайных величин показывает, что среднее время ожидания заявок медленно увеличивается с увеличением длительности моделирования (числа заявок, пропускаемых через модель), но так и не достигает точного значения, полученного аналитически, в некоторых случаях даже после прохождения через моделируемую систему более 100 млн. заявок.
Литература
1. Бражник А. Н. Имитационное моделирование: возможности GPSS World. — СПб: Реноме, 2006. -439 с.
2. Алиев Т. И. Основы моделирования дискретных систем. — СПб: СПбГУ ИТМО, 2009. — 363 с.
Алиев Тауфик Измайлович — Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, доктор технических наук, профессор, зав. кафедрой, aliev@d1. ifmo. ru
УДК 004. 8
ИЕРАРХИЯ ГЛОБАЛЬНЫХ СТРУКТУР АЛГЕБРАИЧЕСКОЙ БАЙЕСОВСКОЙ СЕТИ КАК СИСТЕМА ГРАФОВ И ГИПЕРГРАФОВ1
А.А. Фильченков
Алгебраические байесовские сети относятся к классу логико-вероятностных графических моделей и позволяют осуществлять логико-вероятностный вывод, в том числе и в отношении знаний с неопределенностью, формализуемых через скалярные и интервальные оценки истинности пропозициональных формул. В работе рассмотрены глобальные структуры алгебраической байесовской сети, предложена их систематизация через гиперграфовое представление и выявлена их функциональная иерархия. Предложенная систематизация позволяет приложить методы теории гиперграфов к решению ряда задач анализа глобальных структур алгебраической байесовской сети, в частности, предложить и обосновать критерий для выявления ацикличности ее первичной структуры, а также формирует теоретическую основу алгоритмизации автоматического обучения указанных сетей.
Ключевые слова: алгебраическая байесовская сеть, графы смежности, машинное обучение, глобальная структура, вероятностные графические модели.
Введение
Алгебраические байесовские сети (АБС) лежат на стыке двух классов основных подходов, применяемых к построению математических моделей баз знаний с неопределенностью. Первый из этих классов — подходы, использующие оценки истинности над фрагментами знаний (ФЗ). Ко второму классу относятся так называемые «сетевые» подходы, заключающиеся в использовании графов для моделирования связей (причинно-следственных, логических, реляционных) между элементами или наборами элементов базы знаний [1, 2].
Так, АБС являются математической моделью базы ФЗ с неопределенностью, в которых, в свою очередь, математической моделью ФЗ выступает идеал конъюнктов с заданными над ними оценками вероятности их истинности [1]. Декомпозиция предметной области на базу (набор) таких моделей ФЗ, с прикладной точки зрения, позволяет снизить требования к вычислительным ресурсам (памяти и времени), необходимым для их хранения и обработки, а с теоретической — служит причиной для выделения двух структур АБС: первичной и вторичной.
Первичная структура АБС тесно связана с подходами первого из рассмотренных классов, поскольку представляет собой набор ФЗ. Вторичная же структура АБС — граф [3, 4], построенный над первичной структурой, — согласуется с «сетевыми» подходами. Эти две структурные особенности позволяют отнести АБС к классу логико-вероятностных графических моделей [5], из которого АБС выделяются возможностью использовать интервальные оценки вероятности истинности для представления неопределенности [1, 2]. Помимо первичной и вторичной структур у АБС выделяют также ряд других глобальных структур [6], тесно связанных друг с другом и играющих ключевую роль при решении задачи глобально-
1
Работа выполнена при финансовой поддержке РФФИ, гранты №№ 12−01−945-а и 12−01−31 202-мол_а.

ПоказатьСвернуть
Заполнить форму текущей работой