Главная > Разное > Теория систем автоматического регулирования
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 25.2. Самонастраивающиеся системы

Самонастраивающиеся системы регулирования должны обеспечивать необходимое качество процессов регулирования при изменении свойств объекта регулирования и элементов регулятора, а также при изменении характеристик возмущающих сил. Различают самонастраивающиеся системы следующих разновидностей:

1) самонастраивающиеся системы с разомкнутыми цепями самонастройки,

2) самонастраивающиеся системы с замкнутыми цепями самонастройки,

3) самонастраивающиеся системы с экстремальной самонастройкой.

Системы с разомкнутыми цепями самонастройки.

Эти системы используются в практике уже сравнительно большое время. Структурная схема подобной системы изображена на рис. 25.8. Здесь и обозначают передаточные функции части системы. Пусть — передаточная функция объекта и регулятора, — передаточная функция некоторого звена, которое будем называть корректирующим устройством.

Под влиянием внешних возмущений происходит изменение передаточной функции

Для компенсации изменений эти же возмущения подводятся к корректирующему устройству с целью изменения его передаточной функции

Передаточная функция замкнутой системы

Очевидно, что для получения постоянства (25.27) необходимо выполнить условие Поэтому передаточная функция корректирующего

устройства должна меняться по зависимости

где — передаточные функции для некоторого начального состояния системы.

Выполнение условия (25.28) сопряжено со значительными трудностями вследствие того, что нельзя точно и полностью учесть все возможные воздействия на объект регулирования. Кроме того, точная реализация зависимости (25.28) во многих случаях затруднительна вследствие технических трудностей. Поэтому во многих случаях реализуется приближенное выполнение этого условия.

Рис. 25.9.

В качестве примера рассмотрим систему автоматического построения вектора по двум составляющим (рис. 25.9). На статорные обмотки синусно-косинусного вращающегося трансформатора поступают напряжения переменного тока и действующие значения которых пропорциональны проекциям вектора на оси х и у. В СКВТ образуется переменный магнитный поток, амплитуда которого пропорциональна модулю вектора: а ось его составляет с осью обмотки, на которую поступает напряжение их, угол Следящая система поворачивает ротор до тех пор, пока напряжение на сигнальной обмотке ротора, включенной на вход усилителя, не станет равным нулю, точнее, минимальным. Тогда ось сигнальной обмотки будет перпендикулярна оси потока статора. Ось второй (квадратурной) обмотки ротора будет совпадать с осью потока. На второй обмотке будет напряжение, действующее значение которого пропорционально модулю искомого вектора;

где числа витков статорных и роторных обмоток.

Угол между осью квадратурной обмотки ротора и осью обмотки статора, на которую подается напряжение их, является аргументом вектора, который строится.

При построении вектора следящая система работает в различных условиях в зависимости от величины модуля строящегося вектора. Это объясняется тем, что крутизна чувствительного элемента, которым является сигнальная обмотка СКВТ, зависит от амплитуды магнитного потока т. е. от модуля вектора. Эта крутизна может быть определена из известного для СКВТ выражения для напряжения сигнальной обмотки;

где — рассогласование между сигнальной обмоткой и осью, перпендикулярной потоку статора.

Для малых углов получаем крутизну чувствительного элемента;

При малых модулях строящегося вектора напряжение мало и мала крутизна чувствительного элемента. Поэтому построение будет производиться с большой ошибкой. При больших модулях вследствие увеличения крутизны чувствительного элемента может быть нарушена устойчивость следящей системы.

В связи с этим в схему построения вектора (рис. 25.9) вводится специальное корректирующее устройство, осуществляющее автоматическое регулирование коэффициента усиления одного из каскадов усилителя Работа схемы АРУ происходит в функции модуля строящегося вектора. Для этой цели может использоваться напряжение квадратурной обмотки ротора осуществляется обычно на каком-либо нелинейном элементе (полупроводниковом диоде, ламповом или полупроводниковом триоде, пентоде, дросселе насыщения и т. д.). АРУ должно работать так, чтобы при увеличении напряжения и соответственно при увеличении крутизны чувствительного элемента коэффициент усиления усилителя уменьшался по гиперболической зависимости. Тогда их произведение будет оставаться постоянным что обеспечит работу следящей системы при постоянном коэффициенте усиления разомкнутой цепи.

Системы с замкнутыми цепями самонастройки

Рассмотрим два принципа построения систем с замкнутыми цепями самонастройки.

На рис. 25.10 изображена схема системы со стабилизацией качества процесса регулирования посредством связей с эталонным фильтром. представляют собой передаточные функции двух звеньев системы. Внешние условия воздействуют на передаточную функцию

Рис. 25.10.

Рис. 25.11.

В качестве эталона используется некоторое звено (фильтр), передаточная функция которого равна желаемой передаточной функции замкнутой системы. Выходная величина у системы регулирования сравнивается с выходной величиной эталона. Разность этих величин после прохождения усилителя с коэффициентом усиления к поступает на вход второго звена.

Результирующая передаточная функция замкнутой системы с дополнительной связью от эталонного фильтра будет

Если коэффициент усиления усилителя к велик, то можно положить Таким образом, при изменении внешних условий передаточная функция замкнутой системы оказывается близкой к эталонной.

Такие системы обладают сравнительно низкими качествами вследствие невозможности практически реализовать значительное увеличение коэффициента усиления к из-за потери устойчивости. Поэтому большее практическое значение имеет другая схема самонастройки, изображенная на рис. 25.11. Эта схема содержит вычислительное устройство дискретного или

непрерывного типа, которое определяет отклонение характеристик замкнутой системы от желаемых или эталонных и в соответствии с имеющимся отклонением воздействует на различные параметры корректирующего устройства с передаточной функцией

Один из возможных путей заключается в определении вычислительным устройством частотных характеристик системы. Для этой цели на вход системы подаются малые колебания некоторых фиксированных частот, для которых определяется частотная передаточная функция системы. В некоторых случаях нет нужды специально подавать на вход колебания фиксированных частот, так как они могут присутствовать во входном сигнале. Задача тогда будет заключаться только в выделении этих колебаний из выходной величины посредством узкополосных фильтров.

После нахождения частотной передаточной функции системы вычислительное устройство определяет требуемые значения параметров корректирующего устройства и посредством исполнительных устройств устанавливает эти значения параметров. В результате характеристики замкнутой системы будут непрерывно корректироваться так, чтобы реализовать приближение их к желаемому виду.

Возможно также определение переходной или весовой функции системы при подаче на вход ступенчатого или импульсного воздействия и реализация воздействия на корректирующее устройство при наличии отклонения от желаемого вида переходного процесса.

Основной трудностью здесь является недопустимость подачи на вход значительных пробных воздействий, так как они могут нарушать основной процесс регулирования. Подача же малых пробных воздействий затрудняет выделение получающейся реакции на фоне помех и шумов.

Для контроля динамических характеристик возможно применение статистических методов. Пусть на входе системы действует случайный сигнал , вызывающий на ее выходе реакцию Тогда взаимная корреляционная функция для этих двух функций времени может быть определена по выражению

где — функция веса системы.

Если при помощи корреляторов определить корреляционные функции то решение интегрального уравнения (25.30) дает весовую функцию. Эта задача возлагается на вычислительное устройство (рис. 25.11).

Указанный метод наиболее прост, когда в пределах полосы пропускания системы имеет белый спектр. Тогда

При статистическом методе определения весовой функции возможно использование имеющихся во входном сигнале шумовых помех в качестве пробных сигналов, что является достоинством этого метода.

Кроме обычных критериев качества, самонастраивающиеся системы характеризуются временем и точностью самонастройки. Так как объект регулирования в самонастраивающейся системе, как правило, имеет переменные параметры, то определение динамических свойств системы по временным или частотным характеристикам должно производиться возможно более быстро, чтобы можно было выявить свойства объекта в текущий момент времени. С другой стороны, все указанные выше методы требуют некоторого конечного времени, определяемого необходимостью накопления

сигналов на фоне шумов. Так, например, при корреляционном методе время самонастройки обычно значительно превышает время переходного процесса, определяемое по затуханию весовой функции (25.30).

На рис. 25.12 в качестве примера изображена схема самонастраивающейся системы с определением амплитудных частотных характеристик. Работа схемы происходит следующим образом. На вход системы поступает пробный сигнал, содержащий фиксированные частоты . Эти частоты на входе и выходе системы выделяются узкополосными фильтрами Ф, а затем в делительных устройствах Д происходит деление выходной амплитуды на входную. Это дает фиксированные точки амплитудной частотной характеристики (или л. а. х.) на пробных частотах . В случае отклонения частотной характеристики от заданного значения сигнал с выхода делительного устройства поступает через усилитель на исполнительный элемент, представляющий собой интегратор, который воздействует на корректирующее устройство с целью восстановления требуемого значения модуля частотной передаточной функции на данной частоте.

Рис. 25.12.

Нетрудно видеть, что процесс самонастройки в этой системе в некотором роде подобен автоматическому синтезу системы регулирования по ее частотным характеристикам. Число дискретных частот пробного сигнала определяется сложностью регулируемого объекта. Оно совпадает с числом опорных точек логарифмической амплитудной характеристики, которое надо иметь, чтобы осуществить синтез системы по методу л. а. х.

Таким образом, самонастраивающиеся системы этого типа (рис. 25.11) представляют собой, по существу, устройства автоматического синтеза систем регулирования по заданным качественным показателям.

Системы с экстремальной самонастройкой.

Эти системы отличаются от рассмотренных выше систем с замкнутыми цепями самонастройки тем, что в них автоматически осуществляется оптимальный синтез системы автоматического регулирования. Структурная схема в этом случае совпадает со схемой, изображенной на рис. 25.11.

Для реализации оптимального синтеза в основу работы вычислительного устройства должен быть положен некоторый критерий оптимальности. При расчете систем автоматического регулирования часто используется критерий минимума среднеквадратичной ошибки, когда минимизируется средний квадрат ошибки:

Очевидно, что реализовать эту оценку для самонастраивающейся системы затруднительно. Это связано, во-первых, с тем, что необходимо вычисление интеграла (25.31) в бесконечных пределах, и, во-вторых, с тем, что оценка остается неизменной во все время работы системы.

Практически легко реализуется минимизация оценки вида

Устройство, реализующее выражение (25.32), представляет собой квадратор (звено, возводящее входную величину в квадрат) и последовательна включенное апериодическое звено с постоянной времени Г. Функция веса такого звена

Выходная величина этого устройства, записанная при помощи интеграла Дюамеля, совпадает с (25.32).

Постоянная времени Т апериодического звена, которое является фильтром нижних частот, должна выбираться так, чтобы устройства изменения параметров корректирующего звена практически не реагировали на случайные быстрые изменения ошибки х.

Системы с экстремальной самонастройкой являются наиболее совершенными самонастраивающимися системами. Они обеспечивают оптимальную настройку системы в условиях изменения характеристик объекта, регулятора и возмущающих сил. Однако они являются наиболее сложными системами и их реализация сталкивается пока со значительными техническими трудностями.

Самонастраивающиеся системы с экстремальной настройкой относятся к категории экстремальных систем с поиском минимума или максимума некоторой величины, определяющей оптимум работы системы. В качестве регулируемых величин здесь выступают параметры корректирующего устройства, например общий коэффициент усиления, значения постоянных времени и передаточных коэффициентов и т. п. Исследование этих систем может производиться в соответствии с теорией экстремальных систем (§ 25.1).

Системы с самоорганизацией.

Самоорганизующиеся системы по своей первоначальной структуре представляют собой набор элементов, связанных между собой случайным образом.

В дальнейшем при внешних возмущениях в них образуются устойчивые отрицательные и положительные обратные связи, подобно тому как в природе происходит приспособление живых организмов к различным внешним условиям. Для живых организмов также характерны отрицательные обратные связи, в результате которых эти организмы «уравновешивают» неблагоприятные внешние воздействия, и положительные обратные связи, усиливающие благоприятные воздействия.

Самоорганизующимся системам свойственна большая универсальность (приспособляемость) и большая надежность по сравнению с обычными системами.

Самоорганизующиеся системы еще не получили распространения, и работа с ними не выходит пока из стадии первых опытов. Так, например, в литературе [47] описывается моделирование на математической машине ИБМ-704 процесса поиска методов решения новой задачи. В машину вводилось много различных программ, в том числе бессмысленные, и ставилась задача. Машина решала задачу наугад, чаще всего неправильно. Результат решения оценивался, и на основе оценки изменялся метод решения. После

нескольких сотен тысяч попыток у машины «накопился опыт» и появилось суждение о правильном методе решения. В дальнейшем она придерживалась этого метода, несколько изменяя его, если изменялись условия.

Задача, которая ставилась машине, состояла в обработке 14-значного числа посредством 63 математических операций. Авторы эксперимента считают, что проще построить машину, способную самостоятельно выработать методику решения, чем точно составить алгоритмы этого решения.

Опыты с самоорганизующимися системами, несомненно, могут принести большую пользу конструкторам сложных систем управления, так как высшая стадия развития жизни на Земле — человек, — по сути дела, возникла на основе принципов самоорганизации неживой природы. Использование этих принципов может привести к весьма совершенным, надежным и универсальным системам управления.

Игровые системы.

Игровые системы используются для управления различного рода операциями: и, в частности, военными операциями. «Игра» или «борьба» может вестись против организованного противника или против сил природы (случайного процесса).

На рис. 25.13 изображена структурная схема игровой системы. Управляющая машина этой системы имеет так называемый игровой алгоритм. Он заключается в сравнении возможных в данной обстановке решений и выборе из большого числа решений оптимального.

Рис. 25.13.

После принятия решения управляющая машина должна сформировать и передать к управляемой операции команды управления.

Сравнение вариантов решений делается управляющей машиной на основе заложенных в нее критериев. Эти критерии выражаются в виде некоторой функции, которую называют функцией выгоды. Установление рациональной функции представляет собой основную проблему при построении игровых систем.

При исследовании игровых систем в настоящее время используется специальная математическая дисциплина — теория игр. Главным содержанием теории игр является обоснование так называемых оптимальных стратегий ведения игры.

Наиболее полно теория игр разработана для конечных игр, для которых характерно конечное число ходов и, следовательно, конечное число возможных стратегий.

В управляющих машинах в настоящее время используются игровые алгоритмы двух видов.

Игровые алгоритмы первого вида используются в системах с набором шаблонных решений. Идея здесь заключается в том, что все возможные решения заранее исследуются и нумеруются. Задачей управляющей машины является выбор такого решения, для которого в сложившейся ситуации будет получено максимальное значение функции выгоды. Недостатком такого принципа является малая гибкость и приспособляемость игровой системы в условиях широкого изменения складывающейся обстановки ведения игры.

В игровых системах второго вида используется идея динамического программирования. Для динамического программирования характерным является решение задачи оптимальности по отдельным этапам и шагам. Поиск оптимального выбора на каждом этапе осуществляется управляющей машиной. Процесс управления в игровой системе с динамическим программированием является замкнутым дискретным процессом. Результат выполнения команд управления на предыдущем этапе является исходным для формирования команд управления на следующем этапе.

Игровые системы автоматического управления являются высшими формами систем управления вообще. Следует ожидать, что в ближайшем будущем они могут найти применение как в военной технике, так и в народном хозяйстве.

Наиболее разработана теория так называемых дифференциальных игр. К ним относятся: задача преследрвания одного управляемого объекта другим, задача приведения управляемого объекта в некоторое заданное состояние при действии заранее неизвестных возмущений, задача управления обгррктом при неполной текущей информации о его состоянии и другие родственные задачи. Предполагается при этом, что отыскиваются оптимальные решения всех этих задач. Наиболее полно теория дифференциальных игр разработана в монографии Н. Н. Красовского [64].

Обычно рассматривается следующая конфликтная ситуация. Два партнера (игрока) могут управлять процессами в некоторой динамической системе, которая описывается дифференциальными уравнениями, представленными в матричной форме;

где х — совокупность фазовых координат, и — управления, которыми могут распоряжаться соответственно первый и второй игроки. Так, например, если рассматривается преследование одного управляемого объекта другим, то х соответствует совокупности фазовых координат двух объектов, а и и — управления одного и другого объектов.

Игра начинается в момент и считается законченной при когда точка попадает на заданное многообразие в рассматриваемом фазовом пространстве.

Задача первого игрока — закончить игру с минимальным значением показателя качества (функционала), называемого также платой за игру

где — известные функции.

Задача второго игрока — помешать приведению точки на заданное многообразие или, при невозможности достичь этого, по крайней мере увеличить плату за игру (25.34).

Ограничения, которые обычно имеют место, задаются в большинстве случаев в виде ограничений на возможные управления: где

и V — некоторые замкнутые области в пространствах управлений и и Могут существовать ограничения и для фазовых координат.

Пусть и — допустимые стратегии, которые могут выбирать игроки. Если первый игрок выбрал стратегию то наихудший результат для него будет при выборе вторым игроком стратегии максимизирующей плату за игру (25.34),

Величина соответствует самому большому проигрышу первого игрока, если он принял Естественно, что первый игрок будет искать такую стратегию для которой для всех допустимых стратегий Из этого следует, что первый игрок должен выбирать стратегию из условия

что соответствует оптимальному решению так называемой минимаксной задачи. Так как возможен случай, когда в допустимых стратегиях V нет такой стратегии V, которая давала бы максимум выражению (25.35), то формулу (25.36) следует записать в виде

Для второго игрока аналогичным образом необходимо найти оптимальную максиминную стратегию из условий

В этом случае второй игрок обеспечит себе выигрыш не меньше значения

Первый игрок не может иметь гарантии, что его проигрыш будет меньше, чем минимальный выигрыш который в соответствии с (25.39) гарантируется второму игроку. Поэтому . В случае равенства возникает так называемая седловая точка игры, для которой

а также

Оптимальные стратегии соответствующие седловой точке игры, определяют для каждого игрока наилучший способ действий. Отклонение любого из игроков от оптимальной стратегии (при условии, что второй игрок придерживается своей оптимальной стратегии) может только ухудшить его результат.

Оптимальные минимаксная и максиминная стратегии не соответствующие седловой точке игры, не обладают подобным свойством.

Примеры дифференциальных игр и методы решения таких задач, как конфликтная задача сближения, игровая задача наведения, информационная игровая задача, задача оптимального преследования и уклонения и др. изложены в работе [64].

<< Предыдущий параграф Следующий параграф >>
Оглавление