Главная > Теория автоматического управления > Теория автоматического управления, Ч.II (Воронов А.А.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Стохастическая линейная оптимальная система управления при неполной информации. Принцип разделимости

Рассмотрим задачу синтеза стохастичёской линейной оптимальной системы управления при неполной информации о состоянии. Пусть объект и наблюдение описываются уравнениями

критерий оптимальности имеет вид

Шумы являются белыми с интенсивностями соответственно; начальное состояние — случайный вектор со средним значением и матрицей дисперсий Шумы и начальное состояние не коррелированы между собой. Матрицы положительно определены. Задача состоит в определении такой функции (функционала)

при которой критерий оптимальности принимает минимальное значение.

Решение этой задачи, т. е. оптимальный закон управления, имеет вид

где К — матрица, определяемая из уравнения

линейная оптимальная оценка, получаемая наблюдателем (фильтром) Калмана—Бьюси:

Соотношения (10.246), (10.247) совпадают с соотношениями (10.138), (10.123), (10.125) и (10.179)-(10.181), определяющими оптимальный регулятор в детерминированной задаче синтеза оптимальных систем и задаче синтеза стохастических линейных оптимальных систем управления с полной информацией, с той лишь разницей, что в (10.246) входит оценка х, а в (10.138) и (10.179) — сам вектор х. Таким образом, стохастический линейный оптимальный регулятор состоит из линейного оптимального наблюдателя и детерминированного оптимального регулятора (рис. 10.10). Этот результат известен как принцип разделения [101 или принцип стохастической эквивалентности [51. В соответствии с этим принципом задача синтеза стохастической линейной оптимальной системы управления

Рис. 10.10

при неполной информации о состоянии разбивается на две: задачу синтеза линейного оптимального наблюдателя и детерминированную задачу синтеза оптимальной системы. Если шумы и начальное состояние подчиняется гауссовскому закону распределения, то соотношения (10.246)-(10.248) определяют стохастический оптимальный регулятор, т. е. регулятор, оптимальный в классе всех систем, а не только линейных.

Для доказательства принципа разделения сначала покажем, что ошибка и оценка х не коррелированы. Уравнение для оценки из (10.248), используя (10.246) и (10.244), можно преобразовать к виду

Это уравнение совместно с уравнением (10.219) для ошибки можно представить в виде

где

Дисперсионное уравнение (10.217) в данном случае принимает вид

где

Представим матрицу Q в виде

где дисперсионная матрица ошибки взаимная корреляционная матрица ошибки и оценки.

Из уравнения (10.249) нетрудно получить

В силу равенств последние два слагаемых в правой части сокращаются, поэтому уравнение для является линейным и однородным. И так как то оно имеет единственное решение Это и доказывает, что ошибка и оценка не коррелированы.

Преобразуем критерий оптимальности (10.245). Используя (10.187), получаем

поэтому

и критерий оптимальности (10.245) можно преобразовать к виду

Последние два слагаемых в этом выражении не зависят от управления. Таким образом, исходная задача свелась к следующей стохастической задаче линейного оптимального управления с полной информацией:

Решение этой задачи, как это следует из решения (10.179), (10.180) задачи (10.175), (10.176), определяется соотношениями (10.246) и (10.247), если слагаемое или его сомножитель является белым шумом. Невязка будет белым шумом, если интеграл от нее, т. е. стохастический процесс определяемый уравнением

является процессом с независимыми приращениями. Чтобы доказать это, рассмотрим совместно процессы Подставив выражение у, последнее уравнение можно преобразовать к виду Это уравнение совместно с уравнением (10.219) для ошибки можно записать в виде где в данном случае

Дисперсионное уравнение для рассматриваемого процесса имеет вид [см. (10.217), (10.218), (10.250)]

Представим матрицу Q в виде

где — матрица дисперсии — дисперсионная матрица ошибки . Из дифференциального уравнения для Q имеем:

В силу равенств второе уравнение является однородным, поэтому оно имеет единственное нулевое решение: Уравнение для принимает вид

откуда

Для корреляционной матрицы имеем [см. (10.216)]

где — фундаментальная матрица уравнения

или

Представим фундаментальную матрицу в виде

Тогда решение (10.254) примет вид

С другой стороны, из уравнений

имеем

где фундаментальная матрица первого уравнения системы (10.255). Следовательно, фундаментальную матрицу системы (10.253) можно записать в виде

Представим корреляционную матрицу в виде

где — корреляционная матрица для

Используя (10.251)-(10.253) и (10.256), из (10.253) получаем

откуда следует, что процесс является процессом с независимым приращением [16].

<< Предыдущий параграф Следующий параграф >>
Оглавление