Главная > Теория автоматического управления > Теория автоматического управления, Ч.II (Воронов А.А.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Наблюдатель (оцениватель, фильтр) Калмана.

Как отмечалось, задача синтеза стохастической оптимальной системы при неполной информации обычно разделяется на задачу оптимальной оценки и задачу синтеза оптимальной системы при полной информации. Рассмотрим задачу оптимальной оценки в дискретном случае. Пусть объект и наблюдение описываются уравнениями

где — последовательность гауссовских случайных величин с характеристиками

символ Кронекера при при гауссовская случайная величина с характеристиками

— симметричные матрицы, причем

Случайные последовательности называются соответственно шумом объекта и шумом наблюдения или измерения, и они не коррелированы со случайной величиной

Требуется, используя измеренные значения переменной при , найти несмещенную оценку вектора , обеспечивающего минимум квадрата ошибки

Напомним, что оценка называется несмещенной, если Условие означает, что ни одна координата выходной переменной не измеряется точно. В этом случае задача оценивания называется несингулярной или невырожденной (неособой).

Решение невырожденной задачи определяется следующим образом [51:

Здесь является математическим ожиданием вектора и служит его априорной оценкой, т. е. оценкой, которая получается до измерения дисперсионная матрица

ошибки , т. е. ошибки априорной оценки; дисперсионная матрица ошибки т. е. ошибки искомой (апостериорной) оценки.

Выражение для оценки содержит кроме априорной оценки поправочный член, пропорциональный невязке — разности между измеренным значением переменной и ее оценкой. При вычислении оценки на каждом шаге нужно начинать с определения априорной дисперсионной матрицы Далее нужно вычислить матрицу коэффициентов усиления и дисперсионную матрицу затем априорную оценку и в последнюю очередь искомую оценку Так как матрицы не зависят от измерений, их можно вычислить заранее при всех необходимых значениях

Соотношения определяющие оптимальный фильтр (оцениватель, наблюдатель), впервые были получены Калманом, поэтому оптимальный дискретный линейный фильтр называют фильтром Калмана.

Установим физический смысл или роль матрицы Для этого рассмотрим случай, когда являются скалярными переменными и . При этом соотношения принимают следующий вид:

Пусть . В этом случае (искомая оценка равна априорной оценке) и измерение, которое производится в момент, при определении оценки не используется. Из физических соображений ясно, что измерение не должно учитываться, если оно никакой информации не несет, т. е. дисперсия его ошибки очень велика . Этот вывод также следует из приведенного соотношения для

Если то , т. е. в этом случае оценка полностью определяется последним измерением. Измерения, произведенные до момента, а также другая априорная информация никак не используются. Очевидно, такая ситуация возникает, когда очень велики (по сравнению с дисперсией ошибки измерения) дисперсии ошибок до момента или дисперсии шума объекта или когда измерение производится без ошибки. Такой вывод следует также из соотношений для

Таким образом, выбором величины регулируется влияние априорной и текущей информации на определение оценки Задача оптимальной оценки состоит в выборе такого при котором наилучшим образом (в оптимальной пропорции) используются априорная и текущая информации. Перейдем к выводу равенств (10.280)-(10.283). В соответствии с принятыми обозначениями

где

Уравнение (10.280) непосредственно следует из (10.275). Вычитая (10.280) из (10.275), находим

откуда

В силу независимости из последнего соотношения получаем (10.283).

Для доказательства первой части равенства соотношения (10.282) подставим в (10.279) выражение для из (10.276). Затем, вычтя каждую часть полученного равенства из преобразуем его к виду

или

Так как независимы, то из последнего соотношения следует первая часть равенства (10.282).

Остается доказать, что средний квадрат ошибки равный следу матрицы Р (С), принимает минимальное значение, если в (10.279) матрица определяется соотношением (10.281). Как легко проверить, первую часть равенства (10.282) (опустив для краткости аргумент можно представить в виде

Если определяется из (10.281), первое слагаемое правой части последнего равенства обращается в нуль. Оставшуюся часть обозначим Р:

Эта матрица в силу свойств дисперсионных матриц является неотрицательно-определенной, поэтому ее диагональные элементы не отрицательны (последнее следует из неравенств которые получаются из при диагональные элементы матрицы Р. Так как матрица является положительноопределенной, то первое слагаемое в (10.284) также является неотрицательно-определенной при произвольной матрице Поэтому след матрицы Р будет минимальным при такой матрице когда первое слагаемое в (10.284) обращается в нуль, т. е. когда определяется соотношением (10.281). При этом из (10.284) получаем вторую часть равенства соотношения (10.282).

Заметим, что здесь вывод соотношений, определяющих фильтр Калмана, был несколько упрощен тем, что структура уравнения (10.279) была задана. Задача оптимальной оценки, таким образом, была сведена к определению оптимальной матрицы коэффициентов усиления.

Стохастическая линейная оптимальная система управ» ления при неполной информации. Пусть объект и наблюдатель описываются уравнениями

и критерий оптимальности имеет вид

Шум объекта и шум наблюдения представляют последовательности независимых гауссовских случайных величин с нулевыми средними, дисперсионными матрицами соответственно; матрицы симметричны, причем при . Начальное состояние является гауссовской случайной величиной со средним значением и дисперсионной матрицей и не зависит от шумов

Требуется найти такое управление

при котором критерий принимает минимальное значение.

Для этой задачи справедлив принцип разделения, или принцип стохастической эквивалентности [51. Поэтому ее решение имеет следующий вид:

Соотношения (10.285) определяют оптимальное управление с обратной связью. Они совпадают с соотношениями (10.266), (10.261)-(10.263), определяющими оптимальный регулятор в случае полной информации, за исключением того, что в

(10.285) входит оценка вместо Оценка получается на выходе фильтра (10.286), совпадающего с фильтром Калмана (10.279)-(10.283). Таким образом, дискретная оптимальная система управления в случае неполной информации, как и аналогичная непрерывная оптимальная система управления, состоит из оптимального фильтра (наблюдателя) и оптимального «детерминированного» регулятора.

Если шумы или значение фазового вектора в начальный момент не являются гауссовскими, то соотношения (10.285), (10.286) определяют линейную оптимальную систему управления, т. е. систему управления, вообще говоря, оптимальную только в классе линейных систем.

<< Предыдущий параграф Следующий параграф >>
Оглавление