Введение
Рассматривается проблема приближенного решения задачи поиска оптимального в среднем управления нелинейными стохастическими системами в условиях неполной текущей информации о координатах вектора состояния [1,2]. Задачи синтеза оптимальных стохастических систем и управления с обратной связью ранее изучались в [3-6], где были сформулированы и доказаны различные условия оптимальности, и разработаны градиентные методы их удовлетворения.
В работе предлагается искать приближенное решение в параметрическом виде путем подбора коэффициентов, входящих в функцию разложения компонент управления. Функция разложения представляет собой сумму произведений элементов систем ортонормированных базисных функций, применяемых в спектральном методе анализа и синтеза нелинейных систем [7], и искомых коэффициентов. Структура функции разложения определяется набором измеряемых координат вектора состояния, используемых в управлении. Ограничения на управление учитываются с помощью применения функции насыщения. Задача нахождения оптимального управления с неполной обратной связью сводится к решению параметрической задачи нелинейного программирования относительно коэффициентов разложения. Для ее решения предлагается применить гибридный меметический алгоритм [8] поиска глобального условного экстремума, относящийся к метаэвристическим [9]. Его применение приводит к получению решения, близкого к оптимальному, за приемлемое время. Эффективность предложенного подхода демонстрируется на задаче оптимальной стабилизации спутника [10].
Постановка задачи
Поведение модели объекта управления описывается стохастическим дифференциальным уравнением Ито:
где
Предполагается, что о компонентах вектора
Начально состояние
где
Предполагается, что при управлении используется информация только о времени
Число
Множество допустимых управлений с неполной обратной связью
с начальным условием (2).
Здесь
Обозначим через
где
Требуется найти такой элемент
Замечание. Если функционал (4) линеен по плотности вероятности, т.е. имеет вид
где непрерывные функции
Стратегия поиска решения
Будем предполагать, что
- Известна оценка множества возможных состояний, которая представляется прямым произведением
- Компоненты закона управления
ищутся в виде
где
- Функции
предлагается искать в виде:
где
В качестве функций
- полиному Лежандра
- косинусоиды:
Стратегия решения заключается в переходе от задачи (5) к задаче поиска минимума функционала с помощью подбора коэффициентов
который представляет собой гиперстолбцовую матрицу, состоящую из
Для решения задачи поиска наилучшего вектора (12) и, как следствие, управления
Для нахождения значения критерия (6) для некоторого вектора
- С помощью начальной плотности вероятности
генерировать начальное состояние . - По вектору
найти соответствующее управление . - Найти решение
уравнения модели (1) с управлением и начальным условием , используя один из численных методов решения стохастических дифференциальных уравнений, например, метод Эйлера-Иосиды: - Повторить пп. 1-3 при
, где N - число генерируемых траекторий, и вычислить значение функционала (4) или (6).
В качестве решения задачи выбирается наилучший вектор
Таким образом, приведенный выше алгоритм, с помощью которого произвольному вектору ставится в соответствие некоторое число, можно рассматривать как целевую оптимизируемую функцию. Вследствие того, что предлагаемый модифицированный гибридный меметический алгоритм относится к эволюционным метаэвристическим алгоритмам поиска глобального условного экстремума функций многих переменных, то полученную функцию можно рассматривать с точки зрения природного понятия приспособленности живого организма, а каждый при этом допустимый вектор – как некоторую особь. Генерируемое же на каждой итерации алгоритма множество особей рассматривается как популяция.
Алгоритм решения задачи
Шаг 1. Подготовительный этап:
- задать число
генерируемых траекторий; - генерировать
начальных точек по заданной плотности вероятности ; - задать векторы, определяющие оценку множества достижимости:
, ; масштабы усечения вектора : .
Шаг 2. Составление целевой оптимизируемой функции. Зададим правило:
Шаг 2.1. Найти решение
Применяя модифицированный гибридный меметический алгоритм к функции :
Алгоритм модифицированного гибридного меметического алгоритма
Шаг 1. Задать область поиска
Шаг 2. Формирование множества
Шаг 2.1. Случайным образом сформировать популяцию
Шаг 2.2. Вычислить значение функции приспособленности для каждой особи
Шаг 2.3. Лучшее решение
Шаг 2.4. Решение
Шаг 3. Решение задачи локального поиска.
Шаг 3.1. Решить задачу
Шаг 3.2. Поместить
Шаг 3.3. Если
Шаг 4. Процедура Path – Relinking.
Шаг 4.1. Положить
Шаг 4.2. Выбрать тройку случайных особей
Шаг 4.3. Найти особь
Шаг 4.4. Добавить особь
Шаг 4.5. Если
Шаг 5. Процедура локального улучшения.
Шаг 5.1. Положить
Шаг 5.2. Положить
Шаг 5.3. Сгенерировать особь
Шаг 5.4. Если
Шаг 5.5. Положить
Шаг 6. Обновление множества
Шаг 6.1. Упорядочить решения, находящиеся в множестве
Шаг 6.2. Положить
Шаг 6.3. Удалить
Шаг 6.4. Удалить из множества
Программное обеспечение
На основе предложенного алгоритма разработано программное обеспечение для поиска оптимального управления непрерывными детерминированными системами. Среда разработки – Microsoft Visual Studio, язык программирования – C#.
C помощью программного обеспечения пользователь может вводить параметры постановки задачи, а также задавать параметры меметического алгоритма и метода решения задачи локального поиска. В программе имеется возможность выбора метода решения задачи локального поиска: муравьиных колоний (непрерывный вариант) либо имитации отжига.
Решение прикладной задачи
Рассмотрим задачу гашения вращательного движения спутника с помощью установленных на нем двигателей.
Движение твердого тела относительно центра инерции описывается системой дифференциальных уравнений
где
В начальный момент времени тело вращается:
Требуется так управлять двигателями, чтобы за фиксированное время
угловые скорости тела:
При этом необходимо минимизировать функционал:
Значения параметров и начальных данных:
На рис. 1 представлены программные управления и проекции угловой скорости, найденные И.А. Крыловым [11]. Минимальное значение функционала:
Рис. 1. Решение, полученное с помощью метода локальных вариаций [11]
Для учета терминальных ограничений к функционалу добавляется слагаемое
В таблице 1 приведены результаты решения задачи, полученные для различных конфигураций управления.
Таблица 1. Результаты работы метода
На рис. 2 изображены некоторые управления и соответствующие им траектории.
Рис. 2. Траектории пучка и управления (полиномы Лежандра)
По данным табл. 1 видно уменьшение значения функционала с ростом количества компонент, по которым имеется информация, т.е. управление с полной обратной связью более эффективно, чем программное управление.
Заключение
В работе предложен гибридный меметический алгоритм и соответствующее программное обеспечение для решения задач поиска оптимального в среднем управления нелинейными стохастическими системами в условиях неполной текущей информации о координатах вектора состояния. Эффективность алгоритма продемонстрирована на примере задачи о стабилизации спутника. Сравнение с результатами, полученными с помощью других методов поиска оптимального управления, показало эффективность меметического алгоритма, позволяющего находить решение, близкое к оптимальному.
Список литературы
- Пантелеев А.В., Руденко Е.А., Бортаковский А.С. Нелинейные системы управления: описание, анализ и синтез. – М.: Вузовская книга, 2008.
- Пантелеев А.В., Семенов В.В. Синтез оптимальных систем управления при неполной информации. – М.:Изд-во МАИ, 1992.
- Пантелеев А.В. Вариационное исчисление в примерах и задачах. – М.: Высшая школа, 2006.
- Kushner H.J., Dupuis P.G. Numerical Methods for Stochastic Control Problems in Continuous Time. – New York: Springer, 2001.
- Bertsekas D.P. Dynamic Programming and Optimal Control – Cambridge: Athena Scientific, 2013.
- Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. – М.: Мир, 1978.
- Пантелеев А.В., Рыбаков К.А. Методы и алгоритмы синтеза оптимальных стохастических систем управления при неполной информации. – М.: Изд-во МАИ, 2012.
- Moscato P. On Evolution, Search, Optimization, Genetic Algorithms and Martial Arts: Towards Memetic Algorithms // Caltech Concurrent Computation Program (report 826), 1989.
- Пантелеев А.В., Метлицкая Д.В., Алешина Е.А. Методы глобальной оптимизации. Метаэвристические стратегии и алгоритмы.- М.: Вузовская книга, 2013.
- Пантелеев А.В., Письменная В.А. Применение меметического алгоритма в задаче оптимального управления пучками траекторий нелинейных детерминированных систем с неполной обратной связью // Известия РАН. Теория и системы управления. 2018. №1. С.1-12.
- Крылов И.А. Численное решение задачи об оптимальной стабилизации спутника // Вычислительная математика и математическая физика. 1968. № 8(1). С. 284-291.