Математическая модель системы слежения РЛС

Тип работы:
Дипломная
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Содержание

  • Содержание 1
  • Введение 3
  • 1 Общая теория оптимального управления 6
    • 1.1 Допустимые управления 6
    • 1.2 Основные направления в теории оптимальных процессов 11
      • 1.2.1 Метод динамического программирования 12
      • 1.2.2 Принцип максимума 13
    • 1.3 Программное управление 16
    • 1.4 Постановка задачи и способы решения 18
  • 2 Система оптимального управления 24
    • 2.1 Математическое описание электромеханической системы 24
    • 2.2 Идентификация авторегрессионно-регрессионной модели 29
    • 2.3 Формирование ограничений 37
    • 2.4 Формирование оптимальных траекторий 42
    • 2.5 Анализ решений 50
    • 2.6 Общая структура системы оптимального управления 55
    • 2.7 Полученные результаты 58
  • 3 Практическая реализация 63
    • 3.1 Реализация оптимального управления в среде пакета matlab 63
    • 3.2 Выбор микроконтроллера 64
  • 4 Экономическое обоснование проекта 66
    • 4.1 Технико-экономическая характеристика 66
    • 4.2 Маркетинговая ориентация 66
    • 4.3 оценка научно-технической результативности и социальной эффективности НИР 68
    • 4.4 Производственный план 74
      • 4.4.1 Расчёт затрат на разработку 75
      • 4.4.2 Затраты на создание опытного образца 77
      • 4.4.3 Затраты на эксплуатацию 79
      • 4.4.4 Ценообразование 79
    • Выводы 80
  • 5 Безопасность и экологичность проекта 81
    • 5.1 Анализ опасных и вредных факторов 82
    • 5.2 Мероприятия по улучшению условий труда 83
      • 5.2.1 Помещения и их освещение 83
      • 5.2.2 Уровень шума и вибрация 85
      • 5.2.3 Параметры микроклимата 86
      • 5.2.4 Защита от электромагнитных и электростатических полей 87
      • 5.2.5 Электробезопасность 90
      • 5.2.6 Дисплейные терминалы и ПЭВМ в составе АРМ 91
      • 5.2.7 Организация и оборудование рабочих мест с ВДТ и ПЭВМ 93
      • 5.2.8 Требования к организации режима труда и отдыха при работе на АРМ 95
    • 5.3 Устойчивость проекта к чрезвычайным ситуациям 97
    • 5.4 Экологичность проекта 98
    • 5.5 Выводы 99
  • Заключение 100
  • Приложение 101
    • Блок-схема файл-функции OPTIMUM_CONTR 101

Введение

Во многих областях техники и технологии приходится иметь дело со следующей задачей, которую можно трактовать как задачу «сопровождения цели». Причем, наблюдаемый процесс в некоторых случаях является детерминированным, т. е. полностью определенным, а в некоторых -- не известным, но и в том и в другом случае в нем присутствует шум -- случайная составляющая. Заданием для управляемого объекта служит движение другого объекта -- задающего. Таким образом, задача слежения сводится к задаче перевода системы из начального состояния в наперед заданное состояние, которое определяется фазовым состоянием наблюдаемой системы.

В начальный момент времени t0 объект находится в фазовом состоянии x0; требуется выбрать такое управление u(t), которое переведет объект в заранее заданное конечное фазовое состояние x1 (отличное от x0). При этом нередко бывает, что начальное состояние x0 заранее неизвестно.

Такое управление часто осуществляется человеком (оператором), который следит за приборами и старается выбирать управление, поддерживающее объект в требуемом рабочем режиме.

Однако в современных условиях высокого развития техники оператор зачастую не может успешно справиться с этой задачей ввиду сложности поведения объекта, большой быстроты протекания процессов и т. п. Поэтому чрезвычайно важно создать такие приборы, которые сами, без участия человека, управляли бы работой объекта (например, в случае выхода объекта из рабочего состояния возвращали бы его в это рабочее состояние). Такие приборы сейчас очень распространены в технике, их изучением занимается теория автоматического управления.

В общем случае на вход регулятора подаются фазовые координаты объекта. Регулятор конструируется так, что его выходная величина u, поданная на вход объекта, нужным образом управляет работой объекта (т. е., например, возвращает объект в рабочее состояние, если он почему-либо вышел из этого состояния).

Обычно требуется, чтобы переходный процесс (т. е. процесс перехода из начального фазового состояния x0 в предписанное конечное состояние x1) был в определенном смысле «наилучшим», например, чтобы время перехода было наименьшим или чтобы энергия, затраченная в течение переходного процесса, была минимальной и т. п. Такой «наилучший» переходный процесс называется оптимальным процессом.

Разумеется, желательно, чтобы регулятор не просто возвращал объект в рабочее состояние, а делал это наилучшим образом, например, в смысле быстродействия (т.е. возвращал объект в рабочее состояние за кратчайшее время). В связи с этим в теории автоматического управления рассматриваются весьма различные (по устройству и степени сложности) регуляторы. Рассмотрение регуляторов, которые применялись на практике и изучались в руководствах по автоматическому регулированию до возникновения теории оптимальных процессов, приводит к выводу, что уменьшение времени переходного процесса связано с усложнением конструкции регулятора; поэтому, усложняя конструкцию регулятора, можно лишь приближаться к «идеальному», «оптимальному» регулятору, который во всех случаях осуществляет переходный процесс за кратчайшее время.

Одной из важных заслуг теории оптимальных процессов является установление существования оптимальных регуляторов и создание математического аппарата, позволяющего рассчитывать такие регуляторы. Оптимальные регуляторы существенно отличаются от тех, которые до сих пор изучались в теории автоматического управления.

На данном уровне развития техники и технологии для такого рода управления в большинстве случаев используются стандартные регуляторы (например, ПИД-регуляторы). Во многих случаях их применение может быть оправдано и их работа удовлетворяет поставленным целям управления, но существуют ситуации, в которых применение таких регуляторов не дает необходимого результата. Использование ПИД-регуляторов может оказаться нецелесообразным в случае ограничений на управление. В такой ситуации, система в целом оказывается существенно нелинейной и классические приемы управления в этом случае не приемлемы.

В данной работе рассматривается система, состоящая из двух электроприводов, один из которых является ведущим, а другой -- ведомым. Ведомый двигатель должен двигаться синхронно с ведущим. Система должна отрабатывать заданную траекторию с необходимой точностью и максимальным быстродействием.

1 Общая теория оптимального управления

1.1 Допустимые управления

Наиболее перспективным решением экстремальных задач является их решение на основе теории принципа максимума Понтрягина. В данной работе ставилась задача оптимизации по времени, для чего и были использованы методы оптимального управления, предложенные Л. С. Понтрягиным, В. Г. Болтянским, Р. В. Гамкрелидзе. [1]

Задача оптимального быстродействия заключается в отыскании такого управления u(t), для которого фазовая траектория x(t) проходит через точку x1 и переход из х0 в х1 осуществляется за кратчайшее время. Такое управление u(t) называется оптимальным управлением (в смысле быстродействия); точно так же соответствующую траекторию x(t), по которой фазовая точка за кратчайшее время переходит из состояния x0 в состояние x1 называется оптимальной траекторией.

Обычно управляющие параметры u1,…, ur не могут принимать совершенно произвольные значения, а подчинены некоторым ограничениям. Это обусловлено техническими характеристиками реальных объектов управления, а также конструкцией регулирующих устройств.

Например, для двигателя постоянного тока (ДПТ), одним из управляющих параметров служит напряжение якоря; однако именно в силу конструктивных особенностей ДПТ этот параметр подчинен ограничениям указанного типа. Так, значение этого параметра не может принимать сколь угодно большое значение.

Для объекта, содержащего r управляющих параметров u1, u2, …, ur, в приложениях часто встречается случай, когда эти параметры могут произвольно меняться в следующих пределах:

Т. е. каждая из величин u1, u2, …, ur представляет собой отдельный управляющий параметр, область изменения которого не зависит от значений остальных управляющих параметров и задается неравенствами

(1. 1)

Заметим, что при r = 2 точки, координаты которых подчинены неравенствам (1. 1), заполняют прямоугольник (рисунок 1. 1); при r = 3 неравенства (1. 1) определяют в пространстве переменных u1, u2, u3 прямоугольный параллелепипед.

В общем случае будем считать, что в соответствии с конструкцией объекта и условиями его эксплуатации задано в пространстве переменных u1, …, ur некоторое множество U и управляющие параметры u1, u2, …, ur должны в каждый момент времени принимать лишь такие значения, чтобы точка принадлежала множеству U. Т. е. разрешается рассматривать лишь такие управления u(t), что для любого t. Множество U называется областью управления.

Область управления U, в общем случае, может быть не только параллелепипедом, но может иметь более или менее геометрически сложный характер, так как благодаря конструкции объекта между управляющими параметрами могут существовать некоторые связи, выражаемые некоторыми уравнениями или неравенствами. Указанные области управления должны входить в математическое описание объекта.

Для технических задач важен случай замкнутого множества U, т. е. случай, когда точка может находиться не только внутри множества, но и на его границе. Т. е. для «рулей» допустимы и их крайние положения.

Для полного осмысления данного вопроса необходимо сделать еще одно, очень важное, предположение о характере управлений. Возможны несколько случаев представления управляющих воздействий. А именно, в одном случае, когда это позволяет точность представления, можно предполагать, что «рули», положения которых характеризуются управляющими параметрами u1, u2, …, ur, безынерционны, так что есть возможность, если нужно, мгновенно переключать эти «рули» из одного положения в другое, т. е. менять скачком значения управляющих параметров u1, u2, …, ur в пределах области управления.

В другом случае, когда точность расчетов не допускает таких приближений нужно предполагать, что управляющие воздействия не могут меняться скачкообразно на сколь угодно большую величину, т. е. существует ограничение не только на значение управляющего параметра, но и на скорость изменения этого параметра. В этом случае достаточно написать, где -- скорость изменения управляющего параметра, и принять за управляющий параметр величину. Т. о. существует ограничение вида

(1. 2)

что несколько осложняет поиск оптимального управления.

Всякий реальный процесс обладает некоторой «инерционностью», но во всяком реальном управляемом объекте всегда можно найти такие управляющие параметры, которые, в пределах заданной точности, можно считать безынерционными.

В соответствии с этим будут рассматриваться не только непрерывные, но и кусочно-непрерывные управления u(t). Класс кусочно-непрерывных управлений хорош тем, что, во-первых, позволяет получить точное математическое решение оптимальной задачи для широкого класса примеров, а во-вторых, наиболее интересен и удобен для технической реализации.

Необходимо уточнить, что функция со значениями в области управления U называется кусочно-непрерывной, если она состоит из конечного числа непрерывных кусков (рисунок 1. 2), т. е. непрерывна для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u(t) может терпеть разрывы первого рода; последнее означает, что в каждой точке разрыва предполагается существование конечных пределов слева и справа:

Значение кусочно-непрерывного управления u(t) в точке разрыва не играет сколько-нибудь существенной роли. Однако для определенности будет удобно предполагать, что управление u(t) в точках разрыва непрерывно справа, т. е. что в каждой точке разрыва значение управления u(t) равно пределу справа:

Кроме того, предполагается, что каждое рассматриваемое управление u(t) непрерывно в концах отрезка на котором оно задано, т. е. что все его точки разрыва, если они есть, расположены на интервале .

Допустимым управлением называют всякую кусочно-непрерывную функцию со значениями в области управления U, непрерывную справа в точках разрыва и непрерывную в концах отрезка на котором она задана.

Оптимальные управления оказываются, в большинстве случаев, разрывными (т.е. содержащие скачки и переключения). Если разрывная функция, график которой изображен на рисунке 1.3 сплошной линией, представляет собой оптимальное управление, то, «сгладив» эту функцию (пунктир на рисунке 1. 3), будет получена близкая к ней непрерывная функция. Но какая бы «близкая» к оптимальному управлению непрерывная функция ни была, всегда можно выбрать «сглаживающий» кусок еще более крутым и получить непрерывную функцию, еще более близкую к оптимальному управлению. Таким образом, в классе непрерывных функций просто не будет наилучшего, оптимального управления, а предельным случаем является кусочно-непрерывная функция, которая и является оптимальным управлением.

1.2 Основные направления в теории оптимальных процессов

Теория оптимальных процессов базируется на методе динамического программирования, разработанного Р. Беллманом, а также на принципе максимума Понтрягина. Для линейных систем принцип максимума был доказан Р. В. Гамкрелидзе. Кроме того, ему принадлежит теорема о конечности числа переключений. Доказательство принципа максимума для нелинейных систем принадлежит В. Г. Болтянскому.

Далее кратко рассмотрим общие принципы метода динамического программирования и принципа максимума.

1.2.1 Метод динамического программирования

Для получения уравнения Беллмана и формулировки теоремы, являющейся сущностью метода динамического программирования автором данной теории были выдвинуты следующие гипотезы.

Гипотеза 1. 1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x в точку x1.

Время, в течение которого осуществляется оптимальный переход из точки x в точку x1, обозначим через Т (х). И пусть

w(x) = -- T(x).

Гипотеза 1.2. Функция w(x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные

На основе этих гипотез была сформулирована и доказана теорема 1.1.

Теорема 1.1. Если для управляемого объекта, описываемого уравнением, и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1. 3) и (1. 4) (оптимальность понимается в смысле быстродействия).

для всех точек x x1 и u,

(1. 3)

для любого оптимального процесса (u(t), x(t)). (1. 4)

Эта теорема и составляет сущность метода динамического программирования.

Метод динамического программирования (1. 3), (1. 4) содержит некоторую информацию об оптимальных процессах и потому может быть использован для их разыскания. Однако он имеет ряд неудобств. Во-первых, применение этого метода требует нахождения не только оптимальных управлений, но и функции w(x) так как эта функция входит в соотношения (1. 3), (1. 4). Во-вторых, уравнение Беллмана представляет собой уравнение в частных производных относительно функции w. Указанные обстоятельства сильно затрудняют возможность пользования методом динамического программирования для отыскания оптимальных процессов в конкретных примерах. Но самым главным недостатком этого метода является предположение о выполнении гипотез 1.1 и 1.2. Ведь оптимальные управления и функция w заранее неизвестны, так что гипотезы 1.1 и 1.2 содержат предположение о неизвестной функции, и проверить выполнение этих гипотез по уравнениям движения объекта невозможно.

Далее кратко излагается сущность принципа максимума, который является значительно более удобным средством для отыскания оптимальных процессов, чем метод динамического программирования.

1.2.2 Принцип максимума

Гипотеза 1.3. Функция w(x) имеет при x x1 вторые непрерывные производные, а функции -- первые непрерывные производные.

Теорема 1.2. Предположим, что для рассматриваемого управляемого объекта, описываемого уравнением

(1. 5)

И предписанного конечного состояния x1 выполнены гипотезы 1. 1, 1.2 и 1.3. Пусть, -- некоторый процесс, переводящий объект из начального состояния x0 в состояние x1. Введем в рассмотрение функцию H, зависящую от переменных и некоторых вспомогательных переменных

  • (1. 6)
  • С помощью этой функции H запишем следующую систему дифференциальных уравнений для вспомогательных переменных:
  • (1. 7)
  • Тогда, если процесс является оптимальным, то существует такое нетривиальное решение, системы (1. 7), что для любого момента t,, выполнено условие максимума
  • (1. 8)
  • и условие
  • Эта теорема значительно удобнее для отыскания оптимальных процессов, чем метод динамического программирования. Однако в приведенной здесь форме принцип максимума страдает тем же недостатком, что и метод динамического программирования: он выведен в предположении дифференцируемости (и даже двукратной) функции w(x), а эта функция, как уже отмечалось, в действительности не является всюду дифференцируемой.
  • Однако принцип максимума доставляет достаточную информацию для решения поставленной задаче оптимального управления.
  • Благодаря работам Р. В. Гамкрелидзе, принцип максимума был доказан для линейных систем. Им были доказаны теоремы существования, единственности и теорема о числе переключений.
  • В данном случае функция Н принимает вид
  • (1. 9)
  • Выражение (1. 7) в векторной форме записывается в виде
  • (1. 10)
  • а соотношение (1. 8) принимает в данном случае вид
  • (1. 11)
  • Теорема 1.3 (теорема существования). Область управляемости является выпуклым открытым множеством фазового пространства Х; для любой точки х0, принадлежащей области управляемости, существует оптимальное управление, переводящее точку х0 в начало координат.
  • Примечание: Множество G называется открытым, если для каждой его точки можно найти шар с центром в этой точке, целиком принадлежащий множеству G, иначе говоря, множество G открыто, если к нему не причисляется ни одна точка его границы.
  • Областью управляемости объекта называется множество всех тех точек х0 фазового пространства X, из которых возможно при помощи какого-либо допустимого управления попасть в начало координат. Само начало координат тоже причисляется к области управляемости.
  • Теорема 1.4 (теорема о числе переключений). Для каждого нетривиального решения (t) уравнения (1. 10) соотношение (1. 11) однозначно определяет допустимое управление u(t); при этом оказывается, что функция u(t) кусочно-постоянна и ее значениями являются лишь вершины многогранника U.
  • Таким образом, функция u(t) кусочно-постоянна, принимает значения в вершинах многогранника U и определена однозначно. Каждую точку разрыва оптимального управления называют точкой переключения.
  • В общем случае число переключений хотя и конечно, но может быть произвольным. Однако существует один важный для приложений случай, когда число переключений допускает точную оценку. Этот случай рассматривается в теореме принадлежащей А. А. Фельдбауму. В этой теореме говорится (упрощенно), что каждая из функций кусочно-постоянна и имеет не более n--1 переключений (т.е. не более n интервалов постоянства), где n -- порядок системы.
  • Таким образом, принцип максимума является наиболее удобным для решения задачи об оптимальном быстродействии.

1.3 Программное управление

Сегодня оборудование с программным управлением распространено весьма широко, начиная от компаний, входящих в TOP 500 Fortune в больших промышленных зонах, и заканчивая малыми предприятиями частного бизнеса. Действительно весьма трудно найти ту область машиностроения, где еще не используются уникальные возможности этого оборудования. Поэтому каждый специалист в области машиностроения должен хорошо представлять то, что дает производству применение этого весьма интеллектуального оборудования.

Программное управление технологическим оборудованием и процессами охватывает управление движением машин, механизмов, транспортных средств и изменением физических и химических параметров технологического процесса.

Программное управление -- это управление режимом работы или состоянием объекта по заранее заданной программе. При автоматическом программном управлении технологическим оборудованием, соответствующая алгоритму программа записывается в память управляющего устройства с последующим автоматическим считыванием и преобразованием в управляющие сигналы.

Программное управление может быть реализовано на различных классах вычислительных машин, начиная от микроЭВМ и заканчивая мощными вычислительными системами. Каждый из этих классов накладывает на алгоритмы некоторые ограничения, которые необходимо учитывать при разработке алгоритмического обеспечения.

Разрабатываемый алгоритм ориентируется для использования в микроконтроллерах, что накладывает особые ограничения на полученный алгоритм.

Необходимо отметить, что микроконтроллеры выполняют операции для дискретного времени и дискретных величин. Вычисления осуществляются с конечной точностью и за конечное время.

Следует также учитывать тот факт, что микроконтроллеры не вычисляют точных значений интегралов и производных, но могут оценивать их значения в конечных разностях, т. е. с помощью численных методов.

Еще одним из важнейших условий, необходимым для успешной практической реализации, является необходимость учитывать отношение стоимости и мощности микроконтроллеров, которые будут использоваться в производстве.

Таким образом, после определения алгоритма оптимального управления для его реализации на реальном микроконтроллере необходимо выполнить оптимизацию по количеству операций, необходимых для проводимых вычислений, а также выполнить оценку точности вычислений. Оценка точности вычислений налагает ограничения на разрядность используемых микроконтроллеров, что в свою очередь сказывается на стоимости устройства в целом. Поэтому, изначально, алгоритм должен ориентироваться на элементарные операции сложения и вычитания, а также логические операции при переключении режимов.

При наличии сложных функциональных зависимостей, необходимо выполнить оценку их табулируемости для обеспечения высокого быстродействия работы алгоритма.

1.4 Постановка задачи и способы решения

В производстве всегда существовала проблема, сущность которой заключалась в переводе системы из некоторого начального фазового состояния в некоторое заранее заданное конечное состояние. Причем точность перехода должна быть максимальной, а время -- минимальным.

В настоящее время эту проблему решает теория автоматического управления на базе стандартных регуляторов. Примером может служить широко распространенный ПИД-регулятор, на базе которого решается большой круг задач. Во многих случаях результаты, получаемы при использовании этих устройств, удовлетворяют потребностям управления. Там где не требуется очень высокое быстродействие или ограничения, накладываемые конструктивными особенностями и характеристиками реальных объектов на вид и характер переходного процесса не являются очень строгими возможно применять данные устройства.

Но с течением времени, в связи с развитием науки и техники инструменты производства все более усложняются, повышаются и требования к качеству управления. Под качеством понимается не только точность, но и быстродействие. Также возникают ситуации, в которых управление выработанное стандартными устройствами не может быть реализовано в полной мере из-за тех или иных технических характеристик объектов управления. Для удовлетворения современным запросам управления промышленные регуляторы совершенствуются и усложняются, что дает некоторый положительный результат, но приводит также и к нежелательным последствиям. А именно -- с усложнением конструкции уменьшается надежность данного устройства и растет его стоимость, что, в свою очередь, тормозит внедрение его в производство.

Примером не адекватной работы устройств на базе стандартных регуляторов могут служить системы имеющие ограничения на управление. В такой ситуации, система в целом оказывается существенно нелинейной и классические приемы управления в этом случае не приемлемы и для достижения положительных результатов необходимо применять принципиально новые теории и законы, на базе которых можно получить такой вид регуляторов, который удовлетворял бы всем поставленным условиям и требованиям.

Целью данной работы является создание математической модели устройства, позволяющего адекватно управлять объектом при наличии ограничений на управление, причем главным условием ставится минимизация времени переходного процесса системы. Предполагается, что наиболее успешным и перспективным решением такого рода задач будет решение на базе теории принципа максимума Понтрягина.

В данной работе рассматривается радиолокационная установка, которая представляет собой совокупность как минимум двух синхронно вращающихся антенн, приводимых в движение электроприводами. В данной системе существует ведущий электропривод, который задает параметры вращения, и ведомый, который должен в точности повторять траекторию движения ведущего.

Предполагается, что тип двигателей, приводящих в движение эти антенны, не имеет для данной работы особого смысла. Сделаем следующее допущения: в данной системе есть возможность измерять в каждые заданные моменты времени положение ведущей антенны, т. е. есть возможность получать информацию о траектории ведущей антенны. Таким образом в связи со сделанными допущениями, система представляет собой совокупность двух электроприводов.

Ставится следующая задача: ведомый двигатель должен двигаться синхронно с ведущим. Система должна отрабатывать заданную траекторию с необходимой точностью и максимальным быстродействием.

В начальный момент времени оба двигателя могут быть рассинхронизированы. Конкретизируем задачу: необходимо за минимальный промежуток времени вывести ведомый двигатель на траекторию ведущего, причем в конце переходного процесса должны совпадать не только угол, но также и скорость, т. е., другими словами, ведомый двигатель попав на нужную траекторию, должен находиться на ней. Главным условием ставится минимизация времени переходного процесса. Таким образом ставится задача оптимально быстродействия.

Достижение указанной цели обусловлено решением следующих задач:

1. Построение оптимального программного управления системы слежения РЛС;

1.1. Построение оптимизационного функционала;

1.2. Вычисление точек переключения;

1.3. Нахождение оптимальных траекторий;

2. Моделирование полученной системы управления;

3. Проверка сделанных гипотез.

Предполагается, что процесс управления будет иметь циклический характер, так как в результате одного шага управления координаты ведущего и ведомого двигателей будут совпадать с некоторой погрешностью, которая в свою очередь будет являться начальными данными для следующего шага управления и т. д.

Запишем поставленную цель управления в виде:

(1. 12)

где -- J, T -- целевые функционалы по ошибке и времени; -- выходные координаты ведомого двигателя; -- выходные координаты ведущего двигателя.

Выходные координаты ведущего двигателя в данном случае являются заданием.

Как было сказано выше, в реальных системах всегда существуют ограничения на управление, обусловленные техническими особенностями реальных объектов. В данном случае -- это ограничение на напряжение якоря двигателя. Эти условия представляют собой ограничения на величину и на скорость изменения управляющего параметра U. Таким образом эти ограничения выделяют в пространстве управлений некоторое подпространство, называемое, как было сказано выше, областью управления. Область управления представляет собой r-мерный параллелепипед.

В теории принципа максимума было доказано, что управление будет оптимальным в случае движения по граням параллелепипеда области управления. В нашем случае областью управления является прямоугольник, так как множество управлений представляет собой пространство R2. Управление будет представлять собой кусочно-непрерывную функцию.

Движение системы в фазовом пространстве должно проходить по оптимальным траекториям. Оптимальной траектория будет лишь в случае приложения оптимального управления, характер которого описан выше.

Для отыскания оптимального перехода в смысле быстродействия необходимо получить множество оптимальных траекторий. Это множество является общим решением системы уравнений, описывающих объект, при приложенном оптимальном управлении. Вид этих кривых будет описан ниже в главе 2.

Будем решать задачу в базисе ошибок.

Задавшись выражением (1. 13)

(1. 13)

где -- выходные координаты ведомой системы, -- выходные координаты ведущей системы, являющиеся заданием, -- ошибка и скорость ошибки, можно сформулировать задачу в базисе ошибки: за минимальный промежуток времени вывести ошибку и ее производную в нуль.

Так как оптимальное управление имеет вид кусочно-непрерывной функции имеющей точки переключения, то движение системы в базисе ошибок будет проходить по кривым, имеющим конечное число точек переключения (а соответственно и интервалов постоянства), соответствующим точкам переключения управляющего параметра. Таким образом возникает проблема нахождения моментов времени, в которые необходимо изменить значение (переключить) управляющего параметра.

Таким образом общая задача сводится к нахождению области управления, нахождению вида оптимальных траекторий и вычисление моментов времени точек переключения управляющего параметра.

В результате решения общей задачи, сформулированной выше, должен быть получен общий алгоритм функционирования системы оптимального управления, который необходимо оптимизировать для использования в микроконтроллерах.

2 Система оптимального управления

2.1 Математическое описание электромеханической системы

В данной работе рассматривается радиолокационная установка, которая представляет собой совокупность как минимум двух синхронно вращающихся антенн. В данной системе одна из антенн является ведущей -- она задает параметры движения, другая -- ведомая, которая должна в точности повторять траекторию движения ведущей.

Каждая из антенн представляет собой сложную электромеханическую систему, представляющую собой совокупность таких составных частей как электропривод, редуктор и собственно принимающая антенна. Основным источником механической энергии является электропривод. Редуктор служит для преобразования угловых скоростей и соответственно вращающих моментов, выдаваемых двигателем. Редукторы могут быть зубчатые (в том числе червячные) или гидравлические.

Напомним, что в разделе 1.5 были сделаны следующие допущения: в данной системе есть возможность измерять в каждые заданные моменты времени положение ведущей антенны, т. е. есть возможность получать информацию о траектории ведущей антенны; тип двигателя, приводящего в движение антенны является не существенным для данной работы.

Применяемые в настоящее время регулируемые и следящие электроприводы (ЭП) построены, в основном, с применением принципов подчиненного регулирования координат. В качестве координат выступают ток якоря двигателя, его скорость вращения и угол поворота вала двигателя (перемещение исполнительного органа рабочей машины).

Для решения поставленных в разделе 1.5 задач нет необходимости приводить полное точное математическое описание данной электромеханической системы. Так как нашей целью является не описание процессов, протекающих внутри этой системы, а регулирование поведения данной системы в целом. К тому же, как было видно из описанного выше, современные электромеханические системы имеют сложную структуру и их описание будет громоздким, что не дает возможности применения этого описания в однокристальных ЭВМ, на которые ориентируется данный разрабатываемый метод.

В связи с этим предлагается рассматривать данную электромеханическую систему как один неразделимый блок, не останавливаясь на конкретных процессах и взаимосвязях имеющих место быть, т. е. рассматривать данную систему как, так называемый, «черный ящик». На рисунке 2.2 приведена условное изображение этой системы в виде «черного ящика». Известно, что выходными координатами системы являются угол и скорость поворота исполнительного органа рабочей машины (вала двигателя). Входной координатой является момент М, характеризующий тормозящий момент на валу двигателя, развиваемый рабочей установкой; момент сил трения в подшипниках, о воздух, на коллекторе электрической машины и в зубчатых передачах редуктора; тормозящий момент, вызываемый потерями на гистерезис и вихревые токи в сердечнике якоря. Управляющим параметром, в данном случае, является напряжение U на якоре электродвигателя.

Объекты и системы управления состоят из элементов, имеющих различную природу. Для анализа их взаимодействия удобно перейти к единообразному, стандартному описанию.

Так как разрабатываемый метод ориентируется на использование в однокристальных ЭВМ, то описание системы необходимо производить в дискретном виде. Для этого в описании динамической системы вместо дифференциальных уравнений предложено использовать уравнения в конечных разностях или разностные уравнения.

Для математического описания данной системы было предложено использовать разностное уравнение специального вида, которое носит название авторегрессионно-регрессионной модели объекта (АРРМ).

Общий вид авторегрессионно-регрессионной модели порядка (N, L) представлен ниже:

(2. 1)

где АРЧ -- авторегрессионная часть, РЧ -- регрессионная часть; N и L -- целые числа, определяющие порядок АРРМ (); N -- порядок авторегрессионной, а L -- порядок регрессионной части модели; ai и bi -- параметры АРРМ. Вектор параметров определяется на этапе идентификации модели.

Авторегрессионная часть является выходом модели, а регрессионная часть -- входом, т. е. yt является выходным процессом, а xt -- входным. В частном случае, когда N = 0, модель не имеет входа и называется авторегрессионной моделью, если L = 0, то будет получена регрессионная модель. Графическая интерпретация АРРМ приведена на рисунке 2.3. В отличие от дифференциальных уравнений, авторегрессионно-регрессионные модели могут описывать как непрерывные, так и дискретные по своей природе объекты.

В нашем случае входными процессами являются момент М и напряжение на якоре двигателя U, которое также является управляющим воздействием. Выходным параметром является угол поворота оси антенны. Таким образом вид авторегрессионно-регрессионной модели в нашем случае будет иметь вид:

(2. 2)

или если принять в качестве выходного параметра скорость поворота вала, то выражение (2. 2) примет вид:

(2. 3)

где -- параметры модели, (N, M+K) -- порядок модели.

В режиме холостого хода выражения (2. 2) и (2. 3) будут иметь вид:

(2. 4)

(2. 5)

Параметры этих моделей не имеют прямого физического смысла и зависят от выбора шага квантования по времени. Порядок модели как и ее параметры находятся в процессе идентификации.

По своему физическому смыслу модели (2. 3) и (2. 5) являются устойчивыми, а (2. 2) и (2. 4) -- неустойчивыми. Модели (2. 2) и (2. 4) являются неустойчивыми, так как выходная координата (угол поворота) постоянно увеличивается при постоянном входном воздействии (напряжении на якоре), а скорость вращения стремится к некоторому определенному значению.

Авторегрессионно-регрессионная модель является устойчивой, если устойчивой является соответствующая ей авторегрессионная модель. Выполнить анализ устойчивости можно после идентификации параметров модели.

2.2 Идентификация авторегрессионно-регрессионной модели

Идентификация динамической системы заключается в отыскании математических моделей, поведение которых подобно поведению самой системы (объекта). Модель объекта необходима для синтеза законов управления, так как управление определяется в результате анализа прогноза поведения объекта.

При использовании в качестве модели объекта АРРМ предполагается, что объект является линейным (хотя бы для рассматриваемых режимов работы) или допускает линейное описание. Реальные же объекты являются нелинейными.

Для идентификации необходимо выбрать порядок модели (ее вид), а затем идентифицировать ее параметры (коэффициенты). Вид модели определяется экспериментально, из заданного списка возможных моделей. Для каждой из них идентифицируются параметры, и оценивается ее точность. На основании анализа точности описания и сложности модели делается вывод о ее пригодности. Таким образом, в общем случае, процесс выбора модели и идентификации параметров является циклическим процессом.

Для описания данной электромеханической системы будем использовать АРРМ, имеющую вид (2. 2).

На начальном этапе необходимо выбрать порядок авторегрессионно-регрессионной модели. Для достижения этой цели проводился эксперимент, в котором циклически проводился подбор порядка модели с определением точности полученной на каждом шаге модели, исходя из реальных экспериментально полученных данных. Поиск подходящего порядка модели проводился в диапазоне p = 0. 20.

В результате была найдена модель, удовлетворяющая требованиям точности, порядок которой составляет (3, 3). Общий вид АРРМ объекта (электромеханической системы) представлен ниже:

(2. 6)

Если за основу взять выражение (2. 3), то конечная АРРМ будет иметь вид:

(2. 7)

В режиме холостого хода, когда момент М на валу двигателя равен нулю (т.е.), выражения (2. 6) и (2. 7) примут вид:

(2. 8)

(2. 9)

Однако перед окончательным выбором вида математической модели, следует упомянуть следующий факт: особенностью рассматриваемой системы является то, что тормозящий момент на валу электропривода имеет константный характер так как обусловлен, как говорилось в разделе 2. 1, силами трения, а также, так называемой, ветровой нагрузкой, которая симметрично действует и на разгон и на торможение. Таким образом тормозящий момент существует и равен некоторому константному значению, а следовательно он будет учитываться при идентификации системы автоматически.

Таким образом, первый этап идентификации, на котором был определен порядок модели, выполнен. Далее будут использоваться выражения (2. 8) и (2. 9).

Вторым этапом идентификации является нахождение численных значений параметров авторегрессионно-регрессионной модели:, которые по своему смыслу являются весовыми коэффициентами.

Нахождение численных значений параметров модели будем производить с помощью метода наименьших квадратов (МНК). В результате применения метода МНК будет получен вектор оценочных значений параметров модели. Суть МНК заключается в минимизации суммы квадратов ошибок исходных уравнений (2. 8) для данного набора фазовых координат динамической системы.

Для идентификации параметров необходимо наблюдать входные и выходные фазовые координаты системы. Для нашей системы, как упоминалось выше, входной координатой является Ut, выходной координатой -- t. Данные наблюдений заносятся в таблицу (таблица 2. 1):

Таблица 2.1 Исходные данные для идентификации

t

t

t-1

t-2

t-3

Ut

1

0

--

--

--

U0

2

1

0

--

--

U1

3

2

1

0

--

U2

4

3

2

1

0

U3

5

4

3

2

1

U4

-1

-2

-3

U

Далее из таблицы 2.1 формируются матрицы X и Y, которые имеют вид:

Конечной расчетной формулой МНК является выражение (2. 10):

(2. 10)

где -- вектор-столбец оценочных параметров модели (2. 8), X и Y -- указанные выше матрицы.

Таким образом, в результате вычислений получается вектор-столбец оценочных параметров модели (2. 8) имеющий вид:

(2. 11)

Или

Для идентификации модели электромеханической системы использовались данные, экспериментально полученные при проведении исследований динамических характеристик и параметров привода РЛС в ООО НПО «Горизонт» [3]. Значения для каждой фазовой координаты представляют собой векторы, полученные путем измерения данной координаты в конкретные промежутки времени, определяемые временем квантования, которое составило секунды.

В качестве исходных данных выступают скорость поворота исполняемого органа привода и управляющее воздействие. В процессе проведения эксперимента были получены несколько траекторий движения системы, а именно девять, после чего было проведено усреднение результатов. Так как измерения проводились с малым временем квантования, то для уменьшения громоздкости расчетов была проведена интерполяция исходных данных с временем квантования секунды. Экспериментальные данные представлены на рисунках 2.4 -- 2.7 и представляют собой зависимость значений фазовых координат от времени.

На рисунке 2.4 представлены множество траекторий, снятых с экспериментальной установки в процессе эксперимента. На рисунке 2.5 представлены усредненные траектории, а на рисунке 2.6. -- интерполированные; рисунки а) представляют собой угол поворота, а рисунки б) -- скорость. На рисунке 2.7 изображено подаваемое в процессе эксперимента управление.

Используя приведенные исходные данные, была построена таблица, как было показано выше и с помощью нее сформированы матрицы X и Y. Подставив эти матрицы в выражение (2. 10), был получен вектор-столбец оценочных параметров авторегрессионно-регрессионной модели объекта. Значения параметров АРРМ имеют вид, приведенный ниже:

(2. 12)

Таким образом был получен общий вид авторегрессионно-регрессионной модели объекта, который приведен ниже:

(2. 13)

Для получения значений t, необходимо задаться выражением:

Проверим адекватность полученной модели. Для этого сравним исходные данные, полученные экспериментально, и данные полученные с помощью математической модели, вид которой приведен выше.

На рисунке 2.8 представлены эталонная и смоделированная траектории движения системы. На рисунке 2. 8, а изображены графики изменения угла поворота t, а на рисунке 2. 8, б -- графики изменения скорости поворота t. Из графика видно, что авторегрессионно-регрессионная модель объекта, с данными параметрами адекватно описывает поведение реальной системы.

Таким образом был получен вид авторегрессионно-регрессионной модели, удовлетворяющий требованием точности. Процесс идентификации завершился за шаг.

Следует упомянуть тот факт, что данная модель описывает траектории системы не в принятых единицах измерения углов и скоростей, а в некоторых унифицированных импульсах, которые используются в данной электромеханической системе. Для перехода к градусам необходимо воспользоваться следующим выражением: где -- искомый угол, n -- количество импульсов.

2.3 Формирование ограничений

Любая реальная техническая система имеет ограничения на управление. Это обусловлено конструкцией и техническими характеристиками рассматриваемой системы. Ограничения отражаются в технических условиях на эксплуатацию системы.

Управляющим параметром электропривода является напряжение на якоре, которое обозначается U. В связи с техническими особенностями данного объекта управления, напряжение на якоре не может превышать некоторого предельно допустимого значения. Это обусловлено максимальным током в обмотке якоря, а также характеристиками источника энергии, используемого в данной системе. Таким образом, необходимо учитывать это ограничение при разработке управляющего устройства.

Еще одним ограничением на управляющий параметр, является то, что величина не может меняться скачкообразно на сколь угодно большую величину. Это ограничение обусловлено возможностями и конструкцией источника энергии и регулирующего устройства, которое задает характер изменения величины управляющего параметра. Это второе ограничение, накладываемое на управление.

Таким образом в данной работе рассматривается следующий случай: область управления U имеет размерность 2, т. е. эта область представляет собой плоскость в пространстве управлений.

Математически область управления U для данной системы задается следующей системой выражений:

(2. 14)

где первое выражение накладывает ограничение на величину, а второе -- на скорость изменения значения управляющего параметра. Выражение (2. 14) представляет собой ограничения, написанные для непрерывных систем. Так как в рассматриваемом случае рассматривается дискретное время, то перепишем систему (2. 14) в виде, пригодном для дискретных систем:

(2. 15)

где -- представляет собой разность значений управляющего параметра текущего и предыдущего моментов времени, что для дискретных систем является аналогом скорости непрерывных систем.

На рисунке 2.9 представлен общий вид области управления для рассматриваемой задачи.

Реальные численные значения данных границ зависят от коэффициентов масштабирования реальной системы, которые определяются входящими в систему усилителями и преобразователями, и выбираются для каждого моделируемого объекта индивидуально, в строгом соответствии с техническими условиями и правилами эксплуатации. Для данной системы ограничения имеют вид:

(2. 16)

Для того чтобы перейти из пространства управлений в базис времени необходимо воспользоваться теоремой Гамкрелидзе о числе переключений [1]. Движение будет осуществляться по граням области управления, т. е. по сторонам прямоугольника в пространстве управлений. На рисунке 2. 10 представлены ограничения в координатах (t, U).

Ограничение на величину параметра представляет собой две горизонтальные линии, обозначенные на рисунке пунктиром, с ординатами и -. Ограничение на скорость изменения величины управляющего параметра определяется углом наклона траектории:

Как видно из рисунка 2. 10 управление имеет вид кусочно-гладкой функции с несколькими переключениями.

Точки переключений в базисе (t, U), соответствуют вершинам прямоугольника области управления (рисунок 2. 9). Участок 1 на рисунке 2. 11 соответствует движению по часовой стрелке по отрезку BC. Это движение будет длиться до момента достижения точки C, далее движение будет происходить по отрезку CD, на рисунке 2. 11 этому движению соответствует участок 2. Движение по участку CD в пространстве управлений будет длиться до момента достижения точки D и т. д.

Существует один интересный случай, когда скорость управления, скачком меняется на противоположное значение, т. е. в пространстве управлений будет наблюдаться скачок с отрезка BC на отрезок CD. Этому соответствует участок 2' в базисе (t, U). Участок 2'' на рисунке 2. 11 соответствует скачку с отрезка BC на отрезок CD в пространстве управлений, не достигнув точки переключения.

На самом деле такой характер изменения скорости допустим, так как при задании ограничений говорилось, что скачком не может меняться только величина управляющего параметра, тогда как на скорость изменения этого параметра такого ограничения не накладывалось. Это не противоречит рассуждениям приведенным в разделе 1.1. То есть управляющий параметр является не безынерционным, а скорость изменения этого параметра -- безынерционным. Правомерность этого утверждения легко подтверждается физическим смыслом управления, являющегося напряжением на якоре.

Необходимо рассмотреть случай, при котором возникшую ошибку можно ликвидировать за один шаг. Запишем регулятор для АРРМ вида (2. 8), обеспечивающий равенство. Выражение для такого регулятора имеет вид:

ПоказатьСвернуть
Заполнить форму текущей работой