Оптимальное управление системами работы английских ученых. Оптимальное управление. Классификация методов оптимального управления

Для проектирования оптимальной САУ необходима полная информация об ОУ, возмущающих и задающих воздействиях, начальном и конечном состояниях ОУ. Далее требуется выбрать критерий оптимальности. В качестве такого критерия можно использовать один из показателей качества системы. Однако требования к отдельным показателям качества, как правило, противоречивы (например, повышение точности системы достигается уменьшением запаса устойчивости). Кроме того, оптимальная система должна иметь минимально возможную ошибку не только при отработке какого-то конкретного управляющего воздействия, но в течение всего времени работы системы. Следует также учитывать, что решение задачи оптимального управления зависит не только от структуры системы, но и от параметров составляющих ее элементов.

Достижение оптимального функционирования САУ во многом определяется тем, как осуществляется управление во времени, какова программа, или алгоритм управления. В связи с этим для оценки оптимальности систем используют интегральные критерии, вычисляемые как сумма значений интересующего проектировщиков параметра качества системы за все время процесса управления.

В зависимости от принятого критерия оптимальности рассматривают следующие виды оптимальных систем.

1. Системы , оптимальные по быстродействию , которые обеспечивают минимальное время перевода ОУ из одного состояния в другое. В этом случае критерий оптимальности выглядит следующим образом:

где / н и / к - моменты начала и окончания процесса управления.

В таких системах длительность процесса управления минимальна. Простейший пример - система управления двигателем, обеспечивающая минимальное время разгона его до заданной частоты вращения с учетом всех имеющихся ограничений.

2. Системы , оптимальные по расходу ресурсов , которые гарантируют минимум критерия

где к - коэффициент пропорциональности; U(t) - управляющее воздействие.

Такая система управления двигателем обеспечивает, например, минимальный расход топлива за все время управления.

3. Системы , оптимальные по потерям управления (или по точности), которые обеспечивают минимальные ошибки управления на основании критерия где e(f) - динамическая ошибка.

В принципе задача проектирования оптимальной САУ может быть решена простейшим методом перебора всех возможных вариантов. Конечно, такой метод требует больших затрат времени, но современные ЭВМ позволяют в некоторых случаях им воспользоваться. Для решения задач оптимизации разработаны специальные методы вариационного исчисления (метод максимума, метод динамического программирования и др.), позволяющие учесть все ограничения реальных систем.

В качестве примера рассмотрим, каким должно быть оптимальное по быстродействию управление электродвигателем постоянного тока, если подаваемое на него напряжение ограничено предельной величиной {/ лр, а сам двигатель можно представить в виде апериодического звена 2-го порядка (рис. 13.9, а).

Метод максимума позволяет рассчитать закон изменения и(г), обеспечивающий минимальное время разгона двигателя до частоты вращения (рис. 13.9, б). Процесс управления данным двигателем должен состоять из двух интервалов, в каждом из которых напряжение u(t) принимает свое предельное допустимое значение (в интервале 0 - /,: u(t) = +?/ пр, в интервале /| - / 2: u(t) = -?/ пр)* Для обеспечения такого управления в состав системы должен быть включен релейный элемент.

Как и обычные системы, оптимальные системы бывают разомкнутыми, замкнутыми и комбинированными. Если оптимальное управление, переводящее ОУ из начального состояния в конечное и не зависящее или слабо зависящее от возмущающих воздействий, может быть задано как функция времени U = (/(/), то строится разомкнутая система программного управления (рис. 13.10, а).

В программное устройство ПУ закладывается оптимальная программа П, рассчитанная на достижение экстремума принятого критерия оптимальности. По такой схеме осуществляется управ-

Рис. 13.9.

а - с обшим управляющим устройством; б - с двухуровневым управляющим

устройством

Рис. 13.10. Схемы оптимальных систем: а - разомкнутой; б - комбинированной

ление станками с числовым программным управлением и простейшими роботами, производится вывод ракет на орбиту и т.д.

Наиболее совершенными, хотя и наиболее сложными, являются комбинированные оптимальные системы (рис. 13.10, б). В таких системах разомкнутый контур осуществляет оптимальное управление по заданной программе, а замкнутый контур, оптимизированный по минимуму ошибки, отрабатывает отклонение выходных параметров. Используя канат измерения возмущений /*, система становится инвариантной относительно всего множества задающих и возмущающих воздействий.

Для того чтобы реализовать столь совершенную систему управления, необходимо точно и быстро измерять все возмущаюшие воздействия. Однако такая возможность имеется далеко не всегда. Гораздо чаще о возмущающих воздействиях известны только усредненные статистические данные. Во многих случаях, особенно в системах телеуправления, даже задающее воздействие поступает в систему вместе с помехами. А так как помеха представляет собой в общем случае случайный процесс, то удается синтезировать только статистически оптимальную систему. Такая система не будет оптимальной для каждой конкретной реализации процесса управления, но она будет в среднем наилучшей для всего множества его реализаций.

Для статистически оптимальных систем в качестве критериев оптимальности используют усредненные вероятностные оценки. Например, для следящей системы, оптимизированной по минимуму ошибки, в качестве статистического критерия оптимальности используют математическое ожидание квадрата отклонения выходного воздействия от заданного значения, т.е. дисперсию:

Используются и другие вероятностные критерии. Например, в системе обнаружения целей, где важно только наличие или отсутствие цели, в качестве критерия оптимальности применяют вероятность ошибочного решения Р ош:

где Р п ц - вероятность пропуска цели; Р ЛО - вероятность ложного обнаружения.

Во многих случаях рассчитанные оптимальные САУ оказываются практически не реализуемыми ввиду их сложности. Как правило, требуется получение точных значений производных высоких порядков от входных воздействий, что технически очень трудно осуществимо. Зачастую даже теоретический точный синтез оптимальной системы оказывается невозможен. Однако методы оптимального проектирования позволяют строить квазиоптимальные системы, хотя и упрощенные в той или иной степени, но все- гаки позволяющие достичь значений принятых критериев оптимальности, близких к экстремальным.

В общем случае автоматическая система состоит из объекта управления и совокупности устройств, которые обеспечивают управление этим объектом. Как правило, эта совокупность устройств включает в себя измерительные устройства, усилительные и преобразовательные устройства, а также исполнительные устройства. Если объединить эти устройство в одно звено (управляющее устройство), то структурная схема системы выглядит следующим образом:

В автоматической системе информация о состоянии объекта управления через измерительное устройство поступает на вход управляющего устройства. Такие системы называются системами с обратной связью или замкнутыми системами. Отсутствие этой информации в алгоритме управления говорит о том, что система разомкнута. Состояние объекта управления в любой момент времени будем описывать переменными
, которые называются координатами системы или переменными состояния. Их удобно считать координатами- мерного вектора состояния.

Измерительное устройство выдает информацию о состоянии объекта. Если на основании измерения вектора
могут быть найдены значения всех координат
вектора состояния
, то говорят, что система полностью наблюдаема.

Управляющее устройство вырабатывает управляющее воздействие
. Таких управляющих воздействий может быть несколько, они образуют- мерный управляющий вектор.

На вход управляющего устройства поступает задающее входное воздействие
. Это входное воздействие несет информацию о том, какое должно быть состояние объекта. На объект управления может действовать возмущающее воздействие
, которое представляет собой нагрузку или помеху. Измерение координаты объекта, как правило, осуществляется с некоторыми погрешностями
, которые тоже носят случайный характер.

Задачей управляющего устройства является выработка такого управляющего воздействия
, чтобы качество функционирования автоматической системы в целом было бы наилучшим в некотором смысле.

Мы будем рассматривать такие объекты управления, которые являются управляемыми. То есть вектор состояния можно изменять требуемым образом путем соответствующего изменения вектора управления. Будем подразумевать, что объект полностью наблюдаемый.

Так, например, положение летательного аппарата характеризуется шестью координатами состояния. Это
- координаты центра масс,
- углы Эйлера, определяющие ориентацию летательного аппарата относительно центра масс. Положение летательного аппарата можно изменить с помощью рулей высоты, курса, элерона и с помощью уклонения вектора силы тяги. Таким образом управляющий вектор определен следующим образом:

- угол отклонения рулей высоты

- курс

- элерон

- тяга

Вектор состояния
в этом случае определяется следующим образом:

Можно поставить задачу выбора управления, с помощью которого летательный аппарат переводится из заданного начального состояния
в заданное конечное состояние
с минимальными затратами топлива или за минимальное время.

Дополнительная сложность при решении технических задач возникает в силу того, что на управляющее воздействие и на координаты состояния объекта управления, как правило, накладываются различные ограничения.

На любой угол рулей высоты, курса, элерона существуют ограничения:

- тяга сама по себе ограничена.

На координаты состояния объекта управления и их производные также накладываются ограничения, которые связаны с допустимыми перегрузками.

Мы будем рассматривать объекты управления, которые описываются дифференциальным уравнением:

(1)

Или в векторном виде:

--мерный вектор состояния объекта

--мерный вектор управляющих воздействий

- функция правой части уравнения (1)

На вектор управления
накладывается ограничение, мы будем полагать, что его значения принадлежат некоторой замкнутой областинекоторого-мерного пространства. Это означает, что управляющая функция
в любой момент времени принадлежит области(
).

Так, например, если координаты управляющей функции удовлетворяет неравенствам:

то область является-мерным кубом.

Назовем допустимым управлением всякую кусочно-непрерывную функцию
, значения которой в каждый момент временипринадлежит области, и которая может иметь разрывы первого рода. Оказывается, даже в некоторых задачах оптимального управления решение может быть получено в классе кусочно-непрерывного управления. Для того, чтобы выбрать управление
как функцию времени и начального состояния системы
, которое однозначно определяет движение объекта управления, требуется, чтобы система уравнений (1) удовлетворяла условиям теоремы существования и единственности решения в области
. В этой области располагаются возможные траектории движения объекта и возможные управляющие функции
. Если область изменения переменных является выпуклой, то для существования и единственности решения достаточно, чтобы функции

. были непрерывны по всем аргументам и имели непрерывные частные производные по переменным

.

В качестве критерия, который характеризует качество работы системы, выбирается функционал вида:

(2)

В качестве функции
будем предполагать, что она непрерывна по всем своим аргументам и имеет непрерывные частные производные по

.

Любая автоматическая система предназначена для управления каким-либо объектом, должна быть построена таким образом, чтобы осуществляемое ею управление было оптимальным, т.е наилучшем в том или ином смысле. Задачи оптимального управления чаще всего возникают в подсистемах управления технологическими процессами. В каждом случае существует некоторая технологическая задача, для выполнения которой предназначается соответствующая машина или установка (объект управления), снабженная соответствующая системой управления, т.е. речь идет о некоторой САУ, состоящей из объекта управления и совокупности устройств, которые обеспечивают управление этим объектом. Как правило эта совокупность включает в себя измерительные, усилительные преобразовательные и исполнительные устройства. Если объединить усилительные, преобразовательные и исполнительные устройства в одно звено, называемое управляющим устройством или регулятором, то функциональная схема САУ может быть приведена к виду на рис. 1. 1.

Рис. 1. 2 Функциональная схема оптимальной системы

На вход управляющего устройства поступает задающее воздействие, которое содержит инструкцию о том, каково должно быть состояние объекта - так называемое «желаемое состояние».

На объект управления может поступать возмущающие воздействие z, представляющие нагрузку или помеху. Измерение координат объекта измерительным устройством может производиться с некоторыми случайными погрешностями x (ошибка) .

Таким образом, задачей управляющего устройства является выработка такого управляющего воздействия, чтобы качество функционирования САУ в целом было бы наилучшим в некотором смысле. Для определения алгоритма управляющего устройства необходимо знать характеристики объекта и характер информации об объекте и возмущениях, которая поступает в управляющее устройство.

Под характеристиками объекта понимают зависимость выходных величин объекта от входных

где F, в общем случае,-- оператор, который устанавливает закон соответствия между двумя множествами функций. Оператор F объекта может быть задан различными способами: с помощью формул, таблиц, графиков. Его задают и в виде системы дифференциальных уравнений, которая в векторной форме записывается так

где и задавалось начальное и конечное значения вектора.

Существует много различных путей решения рассматриваемой задачи. Но только один способ управления объектом дает наилучший в некотором смысле результат. Этот способ управления и реализующую его систему называют оптимальными.

Чтобы иметь количественные основания для предпочтения одного способа управления всем другим, необходимо определить цель управления, а затем ввести меру, характеризующую эффективность достижения цели -критерий оптимальности управления. Обычно критерий оптимальности - это числовая величина, зависящая от изменяющихся во времени и пространстве координат и параметров системы так, что каждому закону управления соответствует определенное значение критерия. В качестве критерия оптимальности могут быть выбраны различные технические и экономические показатели рассматриваемого процесса.

Иногда к системе управления предъявляются различные, подчас противоречивые требования. Законы управления, которые одновременно наилучшим образом удовлетворяли бы каждому требованию, не существует. Поэтому из всех требований нужно выбрать одно главное, которое должно удовлетворяться наилучшим образом. Другие требования играют роль ограничений. Следовательно, выбор критерия оптимальности должен производиться, только на основании изучения технологии и экономики рассматриваемого объекта и среды. Эта задача выходит за рамки теории ОУ.

При решении задач оптимального управления наиболее важным является задание цели управления, что математически можно рассматривать как задачу достижения экстремума некоторой величины Q -- критерия оптимальности. В математике такую величину называют функционалом. В зависимости от решаемой задачи необходимо достижение минимума либо максимума Q. Например, запишем критерий оптимальности, в котором Q должно быть минимально

Как видно, величина Q зависит от функций.

В качестве критерия оптимальности могут быть приняты различные технические и технико-экономические показатели и оценки. Выбор критерия оптимальности -- это инженерная и инженерно-экономическая задача, которая решается на основе глубокого и всестороннего изучения управляемого процесса. В теории управления широко распространены интегральные функционалы, характеризующие качество функционирования системы. Достижение максимального или минимального значения этого функционала указывает на оптимальное поведение или состояние системы. Интегральные функционалы обычно отражают условия работы объектов управления и учитывают ограничения (по нагреву, прочности, мощности источников энергии и т. д.), накладываемые на координаты .

Для процессов управления использоваться такие критерии:

1. оптимальное быстродействие (время переходного процесса)

2. минимум среднеквадратичного значения ошибки.

3. минимум расхода затрачиваемой энергии.

Таким образом, критерий оптимальности может относиться к переходному или к установившемуся процессу в системе.

В зависимости от критерия оптимальности оптимальные системы можно разделить на два основных класса -- оптимальные по быстродействию и оптимальные по точности.

Системы оптимального управления в зависимости от характера критерия оптимальности можно разделить на три типа:

а) равномерно-оптимальные системы;

б) статистически-оптимальные системы;

в) минимаксно-оптимальные системы.

Равномерно-оптимальная -- это такая система, у которой каждый отдельный процесс является оптимальным. Например, в оптимальных по быстродействию системах при любых начальных условиях и любых возмущениях система приходит наикратчайшим во времени путем к требуемому состоянию.

В статистически-оптимальных системах критерий оптимальности имеет статистический характер. Такие системы должны быть наилучшими в среднем. Здесь не требуется или невозможна оптимизация в каждом отдельном процессе. В качестве статистического критерия чаще всего фигурирует среднее значение какого-либо первичного критерия, например математическое ожидание выхода некоторой величины за определенные пределы.

Минимаксно-оптимальные -- это такие системы, которые в наихудшем случае дают возможно наилучший результат. Они отличаются от равномерно-оптимальных тем, что в ненаихудшем случае могут дать худший результат, чем какая-либо другая система .

Оптимальные системы можно также подразделить на три типа в зависимости от способа получения информация об управляемом объекте:

оптимальные системы с полной информацией об объекте;

оптимальные системы с неполной информацией об объекте и пассивным ее накоплением;

оптимальные системы с неполной информацией об объекте и активным ее накоплением в процессе управления (системы дуального управления).

Существует две разновидности задач синтеза оптимальных систем:

Определение оптимальных значений параметров регулятора при заданных параметрах объекта и заданной структуре системы;

Синтез структуры и определение параметров регулятора при заданных параметрах и структуре объекта управления.

Решение задач первого типа возможно различными аналитическими методами при минимизации интегральных оценок, а также с помощью вычислительной техники (моделирование на ЭВМ), рассматривая заданный критерий оптимальности.

Решение задач второго типа основано на использовании специальных методов: методы классического вариационного исчисления, принципа максимума Понтрягина и динамического программирования Беллмана, а также методы математического программирования. Для синтеза оптимальных систем при случайных сигналах используются методы Винера, вариационные и частотные методы. При разработке адаптивных систем наиболее широкое применение имеют градиентные методы, позволяющие определить законы, изменения настраиваемых параметров.

Определение и необходимость построения оптимальных систем автоматического управления

Системы автоматического управления обычно проектируют, исходя из требований обеспечения тех или иных показателей качества. Во многих случаях необходимое повышение динамической точности и улучшение переходных процессов систем автоматического управления достигается с помощью корректирующих устройств.

Особенно широкие возможности повышения показателей качества дает введение в САУ разомкнутых компенсационных каналов и дифференциальных связей, синтезированных из того или иного условия инвариантности ошибки относительно задающего или возмущающих воздействий . Однако эффект влияния корректирующих устройств, разомкнутых компенсационных каналов и эквивалентных им дифференциальных связей на показатели качества САУ зависит от уровня ограничения сигналов нелинейными элементами системы. Выходные сигналы дифференцирующих устройств, обычно кратковременные по длительности и значительные по амплитуде, ограничиваются элементами системы и не приводят к улучшению показателей качества системы, в частности ее быстродействия. Лучшие результаты решения задачи повышения показателей качества САУ при наличии ограничений сигнала дает так называемое оптимальное управление.

Задача синтеза оптимальных систем строго сформулирована сравнительно недавно, когда было дано определение понятия критерия оптимальности. В качестве критерия оптимальности в зависимости от цели управления могут быть выбраны различные технические или экономические показатели управляемого процесса. В оптимальных системах обеспечивается не просто некоторое повышение того или иного технико-экономического показателя качества, а достижение минимально или максимально возможного его значения.

Если критерий оптимальности выражает технико-экономические потери (ошибки системы, время переходного процесса, расход энергии, средств, стоимость и т. п), то оптимальным будет такое управление, которое обеспечивает минимум критерия оптимальности. Если Же он выражает рентабельность (к. п. д., производительность, прибыль, дальность полета ракеты и т. д.), то оптимальное управление должно обеспечить максимум критерия оптимальности.

Задача определения оптимальной САУ, в частности синтез оптимальных параметров системы при поступлении на ее вход задающего

воздействия и помехи, являющихся стационарными случайными сигналами, рассматривалась в гл. 7. Напомним, что в данном случае в качестве критерия оптимальности принято среднеквадратическое значение ошибки (СКО). Условия повышения точности воспроизведения полезного сигнала (задающего воздействия) и подавления помехи носят противоречивый характер, и поэтому возникает задача выбора таких (оптимальных) параметров системы, при которых СКО принимает наименьшее значение.

Синтез оптимальной системы при среднеквадратическом критерии оптимальности является частной задачей. Общие методы синтеза оптимальных систем основываются на вариационном исчислении. Однако классические методы вариационного исчисления для решения современных практических задач, требующих учета ограничений, во многих случаях оказываются непригодными. Наиболее удобными методами синтеза оптимальных систем автоматического управления являются метод динамического программирования Беллмана и принцип максимума Понтрягина.

Таким образом, наряду с проблемой улучшения различных показателей качества САУ возникает задача построения оптимальных систем, в которых достигается экстремальное значение того или иного технико-экономического показателя качества.

Разработка и внедрение оптимальных систем автоматического управления способствует повышению эффективности использования производственных агрегатов, увеличению производительности труда, улучшению качества продукции, экономии электроэнергии, топлива, сырья и т.

Понятия о фазовом состоянии и фазовой траектории объекта

В технике часто возникает задача перевода управляемого объекта (процесса) из одного состояния в другое. Например, при целеуказании необходимо антенну радиолокационной станции повернуть из начального положения с начальным азимутом в заданное положение с азимутом Для этого на электродвигатель, связанный с антенной через редуктор, подают управляющее напряжение и. В каждый момент времени состояние антенны характеризуется текущим значением угла поворота и угловой скоростью Эти две величины изменяются в зависимости от управляющего напряжения и. Таким образом, существуют три связанных между собой параметра и (рис. 11.1).

Величины характеризующие состояние антенны, называются фазовыми координатами, и - управляющим воздействием. При целеуказании РЛС типа станции орудийной наводки возникает задача поворота антенны по азимуту и углу места. В этом случае будем иметь четыре фазовые координаты объекта и два управляющих воздействия. У летящего самолета можно рассматривать шесть фазовых координат (три пространственные координаты и три компоненты скорости ) и несколько управляющих воздействий (тяга двигателя, величины, характеризующие положение рулей

Рис. 11.1. Схема объекта с одним, управляющим воздействием и двумя фазовыми координатами.

Рис. 11.2. Схема объекта с управляющими воздействиями и фазовыми координатами.

Рис. 11.3. Схема объекта с векторным изображением управляющего воздействия и и фазового состояния объекта

высоты и направления, элеронов). В общем случае в каждый момент времени состояние объекта характеризуется фазовыми координатами а к объекту может быть приложено управляющих воздействий (рис. 11.2).

Под переводом управляемого объекта (процесса) из одного состояния в другое следует понимать не только механическое перемещение (например, антенны РЛС, самолета), но также требуемое изменение различных физических величин: температуры, давления, влажности кабины, химического состава того или иного сырья при соответствующем управляемом технологическом процессе.

Управляющие воздействия удобно считать координатами некоторого вектора называемого вектором управляющего воздействия. Фазовые координаты (переменные состояния) объекта также можно рассматривать, как координаты некоторого вектора или точки в -мерном пространстве с координатами Эту точку называют фазовым состоянием (вектором состояния) объекта, а -мерное пространство, в котором в виде точек изображаются фазовые состояния, называется фазовым пространством (пространством состояний) рассматриваемого объекта. При использовании векторных изображений управляемый объект можно изобразить, как показано на рис. 11.3, где и - вектор управляющего воздействия и представляет собой точку в фазовом пространстве, характеризующую фазовое состояние объекта. Под влиянием управляющего воздействия и фазовая точка перемещается, описывая в фазовом пространстве некоторую линию, называемую фазовой траекторией рассматриваемого движения объекта.

АННОТАЦИЯ

Настоящее пособие знакомит с основными условиями оптимальности и методами решения задач вариационного исчисления и оптимального управления. Будет полезно для подготовки и проведения практических занятий по разделу "Оптимальное управление", а также при выполнении домашних заданий по этой теме студентами.

Учебное пособие является электронной версией книги:
Оптимальное управление в примерах и задачах. Сотсков А.И., Колесник Г.В. - М.: Российская экономическая школа, 2002 - 58 с.

Предисловие

1. Простейшая задача вариационного исчисления.
Уравнение Эйлера
Примеры
Упражнения

2. Задача оптимального управления. Принцип максимума
Примеры
Упражнения

3. Фазовые ограничения в задаче оптимального управления
Примеры
Упражнения

4. Динамическое программирование и уравнение Беллмана
Примеры
Упражнения

Литература

Предисловие

Теория оптимального управления является одним из разделов курса "Математика для экономистов", читаемого в Российской экономической школе.
Опыт преподавания показывает, что данный раздел - один из наиболее сложных для освоения. Это прежде всего связано с концептуальными отличиями изучаемых в нем задач оптимального управления от задач конечномерной оптимизации, и, как следствие, с существенным усложнением используемых в них условий оптимальности.
В связи с этим представляется полезным дать наглядную иллюстрацию применения данных условий оптимальности к решению задач различных типов. Настоящее пособие и является попыткой дать такую иллюстрацию. В нем содержатся примеры и задачи по четырем темам:
. вариационному исчислению;
. принципу максимума в задачах без ограничений;
. принципу максимума при наличии фазовых ограничений;
. динамическому программированию.
Каждый раздел состоит из теоретической части, описывающей базовые понятия и результаты, используемые при решении соответствующих задач, примеров с решениями, а также задач для самостоятельной работы студентов.
Следует подчеркнуть, что данное пособие ни в коем случае не является теоретическим курсом, а ориентировано прежде всего на практическое применение методов оптимального управления. В качестве теоретического пособия по данному разделу можно порекомендовать, например, книгу.
По мнению авторов, данное пособие будет полезным преподавателям при подготовке и проведении практических занятий по разделу "Оптимальное управление", а также студентам при выполнении домашних заданий по этой теме.

Электронная версия книги : [Скачать, PDF, 633.8 КБ ].

Для просмотра книги в формате PDF требуется программа Adobe Acrobat Reader, новую версию которой можно бесплатно скачать с сайта компании Adobe.