Мехатроника Сборник статей технической тематики

Принцип максимума Понтрягина

оцените статью: 12345
Loading ... Loading ...

Принципом максимума называют математический метод, который был разработан академиком Л. С. Понтрягиным и его учениками для решения задач оптимального управления. Предложенная авторами метода математическая модель процесса и чёткое компактное формулирование основного результата — сильных необходимых условий оптимальности, оказались очень удачными. Метод пользуется большой популярностью. Этому в немалой степени способствовала изданная в 1961 году монография “Математическая теория оптимальных процессов”, которая хорошо отвечала духу того времени и была написана с большим педагогическим мастерством. Несмотря на то, что первые публикации по принципу максимума появились уже более сорока лет назад, принцип максимума и в настоящее время остаётся основным инструментом для определения оптимального управления и оптимальных траекторий.

В данном разделе рассматриваются задачи оптимального управления, когда заданы ограничения только на вектор управления. Этому соответствует классический вариант принципа максимума, который наиболее часто используется на практике. Наряду с изложением условий оптимальности в форме принципа максимума, большое внимание уделяется рассмотрению их применения для определения оптимального управления и оптимальной траектории.

Строго говоря, принцип максимума ориентирован на определение программного оптимального управления. Однако он часто позволяет легко выявить структуру оптимального управления и вид оптимальных траекторий, что даёт возможность выделить всю совокупность оптимальных траекторий. Таким образом, принцип максимума можно успешно использовать для синтеза оптимального управления. Большинство рассмотренных ниже примеров посвящены именно определению всей совокупности оптимальных траекторий и, следовательно, синтезу оптимального управления.

Изложение материала начинается с формулировки задачи оптимального управления, хотя она приводится и в первой главе работы. Однако такой способ изложения позволяет читателю (особенно читателю, которого интересует прежде всего прагматическая сторона — решение практических задач по определению оптимального управления) изучить один из наиболее эффективных методов теории оптимального управления, не изучая первой главы работы.

2.1. Необходимые условия оптимальности в форме принципа максимума

1. Задача оптимального управления. Рассмотрим сначала конкретный пример. Пусть имеется двигатель постоянного тока, который работает на механизм . Таким механизмом может быть, например, танковая башня. Движением двигателя можно управлять, изменяя напряжение , подводимое к цепи якоря (напряжение  будем считать постоянным). Из условия электрической прочности напряжение, подводимое к цепи якоря, должно быть ограничено:

.

Пусть требуется осуществить поворот вала двигателя на некоторый заданный угол. Интуитивно ясно, что существует бесконечное множество функций , которые решают поставленную задачу, т. е. обеспечивают поворот вала двигателя на заданный угол. Но тогда естественно поставить ещё одну задачу: среди функций , решающих первую задачу, найти наилучшую в каком — либо смысле, например, осуществляющую поворот на заданный угол за минимально возможное время или с минимальной затратой энергии.

Рис. 2.1.

Сформулируем задачу оптимального управления.

Рассмотрим объект или процесс, который описывается системой дифференциальных уравнений

, ,   (2.1)

или векторным уравнением

,

здесь  и  - -мерные векторы,  - -мерный вектор управления. Вектор  называют фазовым вектором системы или вектором состояния.

Будем полагать, что вектор управления  может принимать свои значения из некоторого множества .  может быть любым множеством -мерного евклидова пространства, например, оно может состоять из совокупности изолированных точек. На рис. 2.2 при  изображён пример множества , состоящего из четырёх изолированных точек.

В этом, кстати, заключается существенное отличие принципа максимума от вариационного исчисления. Из-за принятого способа построения вариаций в вариационном исчислении  может быть только областью в классическом смысле этого слова, т. е. когда оно удовлетворяет свойству связности.

Рис. 2.2.

Будем предполагать, что в уравнениях (2.1) функции   непрерывны по всем своим переменным и непрерывно дифференцируемы по переменным  . В качестве допустимых управлений рассматриваются кусочно-непрерывные функции  , удовлетворяющие условию .

Векторное пространство с декартовыми координатами  будем называть фазовым пространством системы (2.1) и обозначать . Каждому вектору  в фазовом пространстве соответствует некоторая точка (фазовая точка). Если задан вектор  и начальное условие , то систему уравнений (2.1) можно решить. Разным вектор-функциям  будут соответствовать различные решения  уравнений (2.1), т. е. выбором вектора  можно управлять движением системы. Решению , , в фазовом пространстве  соответствует некоторая линия, которая называется фазовой траекторией системы.

Пусть в фазовом пространстве  заданы две точки  и . Рассмотрим следующую задачу. Требуется среди допустимых управлений , , т. е. кусочно-непрерывных вектор-функций  (моменты  и  не фиксированы), переводящих фазовую точку системы (2.1) из заданного начального положения   в заданное конечное положение  , найти управление и траекторию, доставляющие минимум функционалу

.           (2.2)

Управление  и траектория , решающие поставленную задачу, называются оптимальными.

Выбором функции  функционалу (2.2) можно придавать различный физический смысл. Если, например, функция  задаёт секундный расход топлива, то функционал (2.2) выражает общий расход топлива, затрачиваемый на движение от точки  до точки . Ниже особое внимание уделяется частному случаю, когда . В этом случае функционал

(2.3)

задаёт время движения. Управление и траектория, минимизирующие функционал (2.3) называются оптимальными по быстродействию.

Будем предполагать, что функции  и   являются непрерывными по всем своим переменным.

2. Необходимое условие оптимальности. Введём -мерный вспомогательный вектор , определяемый уравнениями:

(2.4)

Если задано управление , начальная точка , и в соответствии с уравнениями (2.1) определена траектория , то система уравнений (2.4) принимает вид

(2.5)

т. е. является системой линейных однородных уравнений. Из теории дифференциальных уравнений известно, что такая система при любых начальных условиях имеет единственное решение, причем функция , являющаяся решением уравнений (2.5), непрерывна по .

Введём функцию

.                                  (2.6)

Функцию  называют функцией Гамильтона. Непосредственной проверкой убеждаемся, что уравнения (2.4) могут быть записаны в виде

(2.7)

Аналогичным образом можно показать, что уравнения (2.1) могут быть записаны следующим образом:

, .

При фиксированном  и  функция  становится функцией вектора управления . Обозначим

.

Если точная верхняя грань значений функции  как функции вектора  достигается в некоторой точке, принадлежащей множеству , то

.

Теорема 2.1 (принцип максимума Понтрягина). Пусть ,     , — допустимое управление, а  - соответствующая ему траектория, переводящие фазовую точку  системы (2.1) из заданного начального положения  в заданное конечное положение , так что , . Если  и  - оптимальное управление и оптимальная траектория, то найдётся непрерывная вектор-функция , удовлетворяющая уравнениям (2.7), что:

1) в каждый момент времени , , функция , рассматриваемая как функция переменного , достигает в точке  максимума

; (2.8)

2) выполнено условие нетривиальности решения системы уравнений (2.7)

; (2.9)

3) в конечный момент времени

, . (2.10)

Можно показать (см. п. 1.5), что если выполняются соотношения (2.7) и (2.8), то функции и , рассматриваемые как функции времени , постоянны. Поэтому соотношения (2.10) можно проверять не обязательно в конечный момент времени , а в любой момент времени .

Отметим, что теорема 2.1 задаёт необходимые условия сильного минимума функционала (2.2) в рассматриваемой задаче на условный минимум. Доказательство теоремы в курсе не рассматривается.

 

Оставить свой комментарий

Статьи по теме
Наверх