Главная > Теория автоматического управления > Теория автоматического управления, Ч.II (Воронов А.А.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Синтез оптимального линейного регулятора выхода.

Рассмотрим систему

где (10.147) — уравнение объекта, (10.148) — уравнение наблюдения, и критерий оптимальности

Здесь — известная векторная функция времени; — неотрицательно-определенная матрица; — положительно-определенные матрицы, зависящие в общем случае от времени. Матрицы А, В, С, Q, R как функции от времени предполагаются непрерывными на интервале Требуется определить управление с обратной связью, при котором критерий оптимальности принимает минимальное значение. Эту задачу назовем задачей синтеза оптимального линейного регулятора выхода, причем если конечно, то назовем задачей синтеза оптимального нестационарного линейного регулятора выхода или коротко — нестационарной задачей выхода; если

и матрицы А, В, С, Q, R постоянны, то назовем задачей синтеза оптимального стационарного линейного регулятора выхода или коротко — стационарной задачей выхода. В стационарной задаче выхода дополнительно требуется, чтобы замкнутая система была асимптотически устойчива.

Задача синтеза оптимального линейного регулятора выхода отличается от рассмотренной задачи синтеза оптимального линейного регулятора состояния тем, что в критерии оптимальности (10.149) входит интегральная квадратичная ошибка выходного (наблюдаемого) вектора, а не вектора состояния, и условие задачи дополняется уравнением наблюдения.

Подставив выражение (10.148) для выходного вектора в функционал (10.149), получим

Таким образом, формально приходим к задаче синтеза оптимального линейного регулятора состояния (10.147), (10.150). Отличие этой задачи от ранее рассмотренной заключается в том, что здесь роль матрицы Q играет произведение поэтому решение задачи синтеза оптимального нестационарного линейного регулятора выхода совпадает с решением (10.122)-(10.125) задачи синтеза оптимального нестационарного линейного регулятора состояния при условии, что в матричном уравнении Риккати . И решение существует и единственно независимо от свойств стабилизируемости и обнаруживаемости системы. Существование и единственность решения следует из существования и единственности решения уравнений (10.123), (10.124) при граничных условиях (10.125).

Решение задачи синтеза оптимального стационарного линейного регулятора выхода совпадает с решением (10.140), (10.141) задачи синтеза оптимального стационарного линейного регулятора состояния при условии, что в алгебраическом уравнении Риккати . Это решение существует и единственно в том и только в том случае, если система (10.147), (10.148) стабилизируема и обнаруживаема [10].

На строгом доказательстве последнего утверждения останавливаться не будем. Ограничимся общими рассуждениями. Так как на неуправляемые координаты воздействовать нельзя, Для возможности решения задачи синтеза асимптотически устойчивой системы необходимо, чтобы они стремились со

временем к нулю. Точно так же, нельзя воздействовать должным образом на невосстанавливаемые координаты, так как неизвестно, как они изменяются. Поэтому необходимо, чтобы они также стремились со временем к нулю (обнаруживаемость). То, что обнаруживаемость и восстанавливаемость являются достаточным условием существования решения, следует из того, что всегда можно выбрать такое управление с обратной связью, при котором восстанавливаемые и управляемые координаты стремятся асимптотически к нулю.

Теперь рассмотрим алгебраическое уравнение Риккати

которое необходимо решить, чтобы определить оптимальный закон управления в задаче синтеза регулятора выхода. Матрица в общем случае является неотрицательно-определенной, хотя матрица Q положительно определена. Очевидно, она является положительно-определенной в том и только в том случае, если только при

В том случае, когда матрица не является положительно-определенной, искомым решением уравнения (10.151), т. е. решением, определяющим оптимальный закон управления, может быть неотрицательно-определенная матрица. При этом уравнение (10.151) не имеет решения, которое было бы положительно-определенной матрицей. Как увидим на примере, из того, что матрица не является положительно-определенной, не следует, что и искомое решение уравнения также не является положительно-определенной матрицей. Можно показать [10], что искомое решение (10.151) является положительно-определенной матрицей в том и только в том случае, если система (10.147), (10.148) вполне восстанавливаема.

Таким образом, если уравнение (10.151) не имеет положительно-определенного решения, т. е. решения, которое является положительно-определенной матрицей, следует искать неотрицательно-определенное решение.

Критерий неотрицательной определенности. Для того чтобы симметричная матрица К была неотрицательно определена, необходимо и достаточно, чтобы все главные миноры определителя (т. е. все миноры, получающиеся из этого определителя вычеркиванием строк и столбцов с одними и теми же номерами, или, иначе говоря, все

миноры, симметричные относительно главной диагонали этого определителя) были неотрицательны.

Пример 10.22. .

В данном случае

Алгебраическое уравнение Риккати имеет вид

или в скалярной форме

Оно имеет положительно-определенное решение

хотя матрица не ивляется положительно-определенной.

Метод решения алгебраического уравнения Риккати. Алгебраическое уравнение Риккати является нелинейным, и в общем случае аналитически решить его не удается. Как было показано, решение этого уравнения совпадает с установившимся решением (дифференциального) матричного уравнения Риккати. Поэтому один из возможных способов его решения основан на нахождении установившегося решения матричного уравнения Риккати (10.137), записанного в обратном времени, при начальном условии , где — произвольная неотрицательно-определенная симметричная матрица.

Рассмотрим еще численный метод Ньютона-Рафсона [10]. Запишем алгебраическое уравнение Риккати в виде

где — в общем случае неотрицательно-определенная матрица (в частности, она может быть равна . Введем матричную функцию

Задача заключается в том, чтобы определить неотрицательноопределенную матрицу К, удовлетворяющую условию . Построим итерационную процедуру. Пусть решение, которое получается на шаге. Положим

Предполагая, что является малой величиной, и пренебрегая квадратичным относительно членом, получим

Приравняв правую часть нулю, получим линейное уравнение

откуда находится

Таким образом, имеем следующую итерационную процедуру:

а) вначале полагается и выбирается

б) из последнего уравнения находится

в) если не превышает допустимой ошибки (допустимая ошибка задается), то итерационная процедура заканчивается; в противном случае увеличивается на единицу и по формуле (10.152) вычйсляется соответствующее новому значению а затем происходит возврат к .

Процедура сходится, если правильно выбрать начальное приближение Справедливо следующее утверждение 1101: если алгебраическое уравнение Риккати имеет единственное неотрицательно-определенное решение, то

при условии, что начальное приближение выбрано таким образом, что матрица асимптотически устойчива (т. е. ее собственные значения имеют отрицательные вещественные части).

Если начальное приближение выбрано неудачно, то может наблюдаться сходимость к произвольному решению алгебраического уравнения Риккати или вообще не сходится. Если матрица А асимптотически устойчива, то целесообразно принять

Метод прогонки решения задачи синтеза оптимальной линейной системы. Выше задача синтеза оптимальной линейной системы (при ) методом динамического программирования была сведена

на к решению матричного уравнения иккати. Здесь рассматривается еще один метод решения этой задачи, основанной на вариационном методе и прогонке (переносе) граничных условий с одного конца на другой. Этот метод, как увидим на примере, иногда позволяет получить аналитическое выражение для оптимального закона управления и тогда, когда матричное уравнение Риккати аналитически решить не удается.

Итак, рассмотрим задачу синтеза оптимальной линейной системы при условии, что уравнение объекта, граничные условия и критерий оптимальности имеют следующий вид:

Здесь для удобства в качестве критерия оптимальности принят функционал (10.121), поделенный на два. Это, очевидно, не должно сказаться на решении задачи, т. е. на оптимальном законе управления.

Составим гамильтониан (принимаем

Найдем уравнения Эйлера-Лагранжа:

Из последнего уравнения

Подставив это выражение, запишем уравнение объекта совместно с первым уравнением Эйлера—Лагранжа:

или где

Условие трансверсальности (10.40) принимает вид

Запишем решение уравнения (10.154), используя его нормированную фундаментальную матрицу удовлетворяющую условию при любом

Представим фундаментальную матрицу в соответствии со структурой уравнения (10.154) в виде

где матрицы размерности

Используя это представление и приняв из (10.156) получим

или после подстановки (10.155)

Исключим из полученной системы уравнений

При этом, по существу, граничное условие из точки на временной оси переносится в точку Сравнивая оптимальный закон управления (10.153) после подстановки в него последнего выражения для с оптимальным законом управления (10.138), получаем

и в частном случае, когда

Соотношения (10.157) и (10.158) определяют решение матричного уравнения Риккати через фундаментальную матрицу системы, состоящей из уравнения объекта и уравнения Эйлера—Лагранжа для сопряженной координаты. Они могут быть - использованы для определения матрицы при решении задач синтеза оптимального линейного регулятора.

Рис. 10,б

Пример 10.23. Простейшая задача перехвата. Решим изложенным методом прогонки задачу перехвата, несколько отличную от задачи, рассмотренной в [5].

Пусть цель движется равномерно и прямолинейно со скоростью . Перехватчик движется с постоянной скоростью Курсовые углы цели и перехватчика (рис. 10.6) достаточно малы:

При этом условии в первом приближении можно записать где — угловая скорость перехватчика. Принимая угловую скорость за управление и введя обозначения можно записать

где

Примем за начальное время . Время перехвата начальное расстояние, — скорость сближения перехватчика и цели. В силу (10 159) в первом приближении

и промахом будет . Потребуем, чтобы промах был равен нулю. Тогда граничные условия имеют вид

Рассмотрим задачу синтеза оптимального управления с обратной связью при двух разных критериях оптимальности.

1. Пусть критерий оптимальности имеет вид

В этом случае

и матрица принимает вид

Непосредственно соотношениями (10.157) или (10.158) воспользоваться нельзя, так как они получены при условии, что правый конец траекторий свободен, а в рассматриваемой задаче координата закреплена. В данном случае условие трансверсальности имеет вид Из (10.153) оптимальное управление

поэтому задача сводится к определению как функции от х. Так как матрица постоянна, фундаментальная матрица учетом граничных условий из соотношения где получаем:

Из первых двух уравнений найдем и подставим в последнее уравнение. Тогда получим

где

Найдем фундаментальную матрицу При постоиииой матрице

Как нетрудно вычислить

Подставив (10.164) в (10.163), получим:

Подставив эти выражения в (10.160)-(10.162), оптимальный закон управления можно записать следующим образом:

При разложив экспоненциальные функции в ряд и отбросив члены, содержащие множитель выше пятой степени, получим

В исходных переменных это соотношение принимает вид

С учетом (10.159) имеем (см. рис. 10.6)

или

Используя это соотношение, оптимальный закон управления можио записать в виде

Это соотношение определяет закон пропорционального сближения с переменным коэффициентом навигации.

2. Пусть теперь критерий оптимальности имеет, вид

В этом случае

и, как легко проверить, имеем:

Точное выражение для фундаментальной матрицы получить не удается. При , используя (10.163) и отбрасывая малые члены более высокого порядка, чем получим:

После подстановки этих выражений в (10.160)-(10.161) оптимальный закон управления записывается в виде

или в исходных переменных

Используя (10.165), получаем

или, учитывай, что

Таким образом, опять оптимальное управление определяет закон пропорционального сближения с переменным коэффициентом навигации. При оба оптимальных закона управления совпадают и приобретают вид

<< Предыдущий параграф Следующий параграф >>
Оглавление