Введение
Рассматривается проблема приближенного решения задачи поиска оптимального в среднем управления нелинейными стохастическими системами в условиях неполной текущей информации о координатах вектора состояния [1,2]. Задачи синтеза оптимальных стохастических систем и управления с обратной связью ранее изучались в [3-6], где были сформулированы и доказаны различные условия оптимальности, и разработаны градиентные методы их удовлетворения.
В работе предлагается искать приближенное решение в параметрическом виде путем подбора коэффициентов, входящих в функцию разложения компонент управления. Функция разложения представляет собой сумму произведений элементов систем ортонормированных базисных функций, применяемых в спектральном методе анализа и синтеза нелинейных систем [7], и искомых коэффициентов. Структура функции разложения определяется набором измеряемых координат вектора состояния, используемых в управлении. Ограничения на управление учитываются с помощью применения функции насыщения. Задача нахождения оптимального управления с неполной обратной связью сводится к решению параметрической задачи нелинейного программирования относительно коэффициентов разложения. Для ее решения предлагается применить гибридный меметический алгоритм [8] поиска глобального условного экстремума, относящийся к метаэвристическим [9]. Его применение приводит к получению решения, близкого к оптимальному, за приемлемое время. Эффективность предложенного подхода демонстрируется на задаче оптимальной стабилизации спутника [10].
Постановка задачи
Поведение модели объекта управления описывается стохастическим дифференциальным уравнением Ито:
где