Меню
Главная
Прикосновение космоса
Человек в космосе
Познаем вселенную
Космонавт
Из авиации в ракеты
Луноход
Первые полеты в космос
Баллистические ракеты
Тепло в космосе
Аэродром
Полёт человека
Ракеты
Кандидаты наса
Космическое будущее
Разработка двигателей
Сатурн-аполлон
Год вне земли
Старт
Подготовки космонавтов
Первые полеты в космос
Психология
Оборудование
Модель ракеты
|
Космонавтика Декомпозиция цифровых систем Пустьминимальное значение/у Дх(г)] описывается выражением ViWi)] = mmJ j[x(i)] При г = Л последнее выражение представляет собой критерий качества, или выигрьпп на последнем (нулевом) шаге, который есть не что иное, как терминальная составляющая. Поэтому fo[x(N)] = G[x(N)] = I x(N)Sx(N) (11-80) При i = N - I получаем одношаговый процесс, или процесс с одним интервалом управления, который совпадает с последним шагом. Тогда оптимальное значение критерия качества fJx(N-l)] =min J [x(N-l)] = u(N-l) = mm u(N-l) G[x(N)] + F Jx(N - l),u(N - 1)] (11-81) Подставляя соотношение (11-77) и соотношение G[x(N)] =1 [0x(N-l) + eu(N-l)]S[0x(N-l)+eu(N-l)] (11-82) в (11-81) и упрощая, получим f, [x(N - 1)] = min 1 u(N-l) x(N-l)(-b0S0)x(N-l)-b -Ь x(N 1)(M + \ 0S8)u(N - 1) + I u(N - l)eS0x(N - 1) + -b u(N- S )u(N- 1) = min J [x(N - 1)] (11-83) u(N-l) Запишем условие минимума /j [ x (Л- 1) ]: aJJx(N- 1)] (11-84) au(N -1) в результате получим [(М I ф80) + I eS0]x°(N - 1) + (R -Ь eS0)u°(N - 1) = О (11-85) Таким образом, оптимальное управление имеет вид u°(N- 1)= -(R+ eS9)-i(M + eS0)x°(N- 1) (11-86) Заметим, что полученный результат совпадает с выражением (11-31) при замене к = N - 1. Подставив теперь выражение (11-86) в (11-83) для X (Л- 1) , после упрощений найдем [x(N - 1)] = I x(N - + ф8ф - - (м + eS0)(fe + eS9)-M -ь eS0)]x(N - i) (1.87) Введем следующие обозначения: .K(N)=S (11-88) K(N- 1) = + ф8ф - (М + 080)Г(К+ в8ву{М + в8ф) (11-89) Заметим, что соотношение (11-89) совпадает с уравнением Риккати (11-34) при k=N-\. Оптимальные значения выигрьппа в соответствии с выражениями (11-80) и (11-81) принимают вид foWN)] =x(N)K(N)x(N) [x(N - 1)] = I x(N - 1)K(N - l)x(N - 1) (11-90) (11-91) Продолжая этот процесс, положим i=N-2,j.e. рассмотрим задачу оптимизации, которая состоит из двух (последних) шагов. Запишем оптимальное значение критерия качества для двухшагового процесса £ lx(N - 2)] = min JHN - 2)] = min [x(N - 2),u(N- 2 u(N-2) u(N-2) L I- u(N-l) u(N-l) - 2)] + F i [x(N- l),u(N- 1)] + G[x(N)]l (11-92) В соотвегствш с принципом оптимальности, для того чтобы двухша-говый процесс был оптимальным независимо от стратегии управления на первом шаге, последний шаг должен быть оптимальным сам по себе. Поэтому запишем соотношение (11-92) в виде f2[x(N - 2)] = тш [Fi.2[x(N - 2),u(N - 2)] + [x(N - 1)]] (11-93) где/1[х(Л- 1)] - оптимальный вьшгрьпц на последнем шаге, описываемый выражением (11-91) . Подставляя соотношения F.gtxN - 2),u(N - 2)] = I x(N - 2)Qx(N - 2) + + x(N - 2)Mu(N - 2) + A - 2)Ru(N - 2) (11-94) fl[x(N- 1)] = [0x(N-2)+ eu(N-2)]ЩN-l)[0x(N-2)-i- (195) (11-96) -beu(N-2)] в выражение (11-93) , переобозначая члены и учитывая aJ2[x(N-2)] au(N-2) можно показать, что оптимальное управление имеет вид u°(N-2)= -[R+ eK(N-l)0]-l[M + eK(N-l)0]x°(N-2);( 11-97) fgWN - 2)] = I x(N - 2)[ + 0K(N - 1)ф -- [M+ eK(N-l)0][R+ eK(N-i)e]-[M-f- + eK(N -1)0] x(N - 2) (11-98) с учетом K(N - 2) = Q + ФЩК - 1)0 - - [M + eK(N-i)0][u + eK(N-i)e]-i[M + eK(N-i)0] (п-99) запишем соотношение (11-98) в компактном виде faWN - 2)] = 1 x(N - 2)K(N - 2)x(N - 2) (11-100) Продолжая процесс, методом индукции можно показать, что в общем случае fN-iWi)] =<OK(l)x(i) (11-101) K(i) = Q + фК(1 + 1)ф - - [М-ь вщ\+ i)0][R+ 6>K(i+ 1)в]-1[м + eK(i + 1)0] (11-102) Оптимальное управление описывается соотношением u°(i)=-[R + eK(i+ 1)е]-1[М+ ещи- i)0]x°(i) (и-юз) Таким образом, мы вывели уравнение Риккати на основании принципа оптимальности. Данный метод решения называется также динамическим программированием. При использовании этого метода не требуется, чтобы матрица 6. была положительноопределенная, поскольку отсутствует вычис1ение R . Более того, R может быть нулевой матрицей. Однако матрица R+0К (/ + + ) 0 должна иметь обратную матрицу. Для бесконечного интервала времени юти бесконечного числа шагов Л = < по аналогии с результатами, полученными в предьщущих параграфах, К(0 заменим К, и соотношения (11-101) - (11-103) принимают вид, совпадающий с соотношениями (11-58), (11-55) и (11-56) соответственно. 11. 5. РЕШЕНИЕ ДИСКРЕТНОГО УРАВНЕНИЯ РИККАТИ Количество опубликованных работ, посвященных решению и свойствам уравнения Риккати, может, по-видимому, составить целую книгу. В общем случае решить алгебраическое уравнение Риккати (11-55) труднее, чем разностное уравнение (11-102). Разностное уравнение Риккати, как правило, решают с помощью одного из следующих методов: численных, рекуррентного и метода собственных значений и собственных векторов. Численные методы подразумевают итеративное решение нелинейного разностного уравнения Риккати. Рекуррентный метод и метод собственных значений и собственных векторов рассмотрены ниже. Рекуррентный метод решения уравнения Риккати. Метод динамического программирования, описанный в п. 11.4, в общем виде представляет собой метод рекуррентного решения задач оптимального управления.
|