Главная - Литература

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 [160] 161 162 163 164 165 166 167 168 169 170 171 172 173 174

Аналогичное неравенство получается и в том случае, когда движение X* [(] на время покидает область

\Xs\<h (s=l.....и). (109.19)

Действительно, в последнем случае имеет место следующая ситуация. Пусть т > 0 ~ момент времени, когда движение [t] в последний раз вошло в область (109.19) и уже при не покидает эту область. Тогда с этого момента вдоль движения х" [t] все время выполняется условие (109.16). Интегрируя это неравенство от = т до = оо и учитывая опять предельное соотношение (109.17), получим: V°{x, x\lx]..... х;[т1)<

< J a(t, x*lt].....xl[t], ullt].....u1[i])d(. (109.20)

Ho no выбору xito) из области (109.9), (109.12) справедливо неравенство

V°(t°. X, (g, .. ., x„ (tg)) < V°(x, x; [x].....xl (Tl), (109.21)

a вследствие неотрицательности функции ю имеем:

/ x\lt].....xllty, <m.....a;[t])dt<

< J m(t. xlm.....x; [ty, u1[t].....u;[t\)dt. (109.22)

Из (109.20)-(109.22) снова следует справедливость неравенства (109.18). Соотношения (109.15) и (109.18) доказывают (109.8). Тем самым теорема IV полностью доказана.

Примечание. В условиях теоремы IV предполагается, что величины Uj в уравнениях (109.1) являются функциями от и х(0-Однако анализ доказательства этой теоремы показывает, что соотношение (109.8) справедливо и в том случае, когда в (109.8) Uj=Uj[t\ представляют собой любые функции времени Uj = Uj{t), обеспечивающие предельное соотношение lim х [1 = 0 при ->оо. Действительно, в этом доказательстве по существу нигде не использовалось

предположение, что функция и* [1 имеет форму и* [1 = и* (t, х* [1.....

X* Щ, а не просто является явной функцией только от врейени t. Следовательно, теорема IV устанавливает оптимальность управления и° = и°. (t, Xj, .. ., х) как по отношению к управляющим воздействиям вида Uj=Uj(t, Xl.....х„), так и по отношению к управляющим воздействиям Uj=Uj{t) для всех начальных возмущений из области (109.9), (109.12),



§ ПО. Замечания ко второму методу Ляпунова в теории стабилизации.

Итак, для решения задачи II об оптимальной стабилизации следует попытаться найти функции К° и и°, удовлетворяющие условиям теоремы IV. При этом необходимо обеспечить выполнение равенства (109.6), которое является уравнением в частных производных относительно искомой функции V°. Уравнение (109.6) надо разрешить с учетом дополнительного условия (109.7). В результате получается достаточно трудная задача. Однако, как и в случае общей задачи об устойчивости движения, где также проблема эффективного построения функций Ляпунова весьма нелегка, можно указать некоторые типы уравнений (109.1), для которых функция V° строится в замкнутой форме. Отыскание этих типов уравнений и построение соответствующих функций К" облегчаются известными результатами теории устойчивости движения. В частности, для линейных систем, как и в обычных задачах устойчивости, полезным аппаратом исследования являются функции V° в виде квадратичных форм.

Функции V°{(, Xl.....х„), удовлетворяющие условиям теоремы IV, будем называть оптимальными функциями Ляпунова, отвечающими соответствующей задаче II об оптимальной стабилизации.

Теорема IV может обобщаться в различных направлениях. Если речь идет о проблеме оптимальной стабилизации в целом (см. стр. 480), то в формулировке теоремы IV достаточно потребовать выполнения соотношений (109.6), (109.7) при всех х (-оо < <-j-oo,

s=l.....«) и добавить условия, обеспечивающие устойчивость

движения х - 0 в целом. Эти условия указаны в примечании к стр. 38. Поэтому мы не будем приводить здесь соответствующую полную формулировку теоремы IV в этом случае. Теорема IV также сохраняет свою силу и в тех случаях, когда управляющие воздействия стеснены дополнительными неравенствами (например, иу1). В таких случаях следует лишь потребовать, чтобы функция V° удовлетворяла неравенству (109.7) при всех значениях Uj, стесненных заданными ограничениями. Можно, наконец, ослабить условия определенной положительности функции m(t, х.....х; и, и),

заменив его условием знакоположительности при дополнительных ограничениях в духе критерия асимптотической устойчивости, данного в приложении III. Изменения, которые при этом следует внести в формулировку теоремы IV, очевидны, и мы на них здесь не останавливаемся.

В теореме IV естественно предполагается, что функция К°(, Xl.....х„) имеет в области (109.2) непрерывные частные произ-

водные -3 (s=l.....«). Для задач оптимального упра-



вления, однако, интересны случаи, когда это предположение не выполняется при отдельных значениях t и х, заполняющих, может быть, некоторые поверхности. Критерий оптимальности, подобный теореме IV, но работающий с применением таких не гладких функций V{t, Хг.....Хп), разработан В. Г. Болтянским).

В заключение этого параграфа сделаем еще несколько кратких замечаний о связи теоремы IV с общими методами вариационного исчисления и, в частности, с известными методами математической теории оптимальных процессов.

Критерий оптимальности воздействий и°., который выражается равенством (109.6) и неравенством (109.7), соответствует известному методу в вариационном исчислении, опирающемуся на теорию распространения возмущений 2). Здесь, однако, в отличие от наиболее распространенной формы необходимых условий экстремальности, критерий приведен в форме достаточных условий минимума интеграла (107.1). При этом условия теоремы IV одновременно обеспечивают выполнение предельного соотношения lim (0 = 0 при->оо. Такая формулировка соответствует характеру основных теорем второго метода Ляпунова исследования устойчивости движения. Поэтому она и выбрана нами здесь. Естественным результатом отмеченной связи теоремы IV с методами классического вариационного исчисления является тот факт, что соотношение (109.6) имеет форму уравнения в частных производных вида известного уравнения Гамильтона-Якоби.

Фундаментальным методом исследования задач об оптимальном управлении является метод, основанный на принципе максимума Л. С. Понтрягина ). В теории оптимальных процессов, развитой Л. С. Понтрягиным и его сотрудниками В. Г. Болтянским, Р. В. Гам-крелидзе и Е. Ф. Мищенко, оптимальное управление Uj ищется в виде функции только от времени = и°. {t) (отдельно для каждых фиксированных начальных условий xit).

Для задачи, аналогичной задаче II, но состоящей в определении управления в форме = и° {f), принцип максимума утверждает, что на оптимальном движении x[t\ системы (109.1), порожденном управлением и. {t), обязательно выполняется условие

H[%it).....Ф„+1(0; t, x\[t].....xiity, «о.....«o]>

>H[\it).....„+,(0; t; x\[t].....х1Щ; «j.....al (ilO.l)

) Болтянский В. Г., Достаточные условия оптимальности и обоснование метода динамического программирования. Изв. АН СССР, серия математическая, т. XXVIII, № ,з, 1964.

2) См., например, монографию: Гельфанд И. М., Фомин СВ., Вариационное исчисление, М., Физматгиз, 1961.

) См. монографию Л. С. Понтрягиаа и др., упомянутую в сноске на стр. 475.



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 [160] 161 162 163 164 165 166 167 168 169 170 171 172 173 174



0.0067