ПОИСК Статьи Рисунки Таблицы Дискретные задачи оптимизации циклических адсорбционных технологических схем из "Циклические адсорбционные процессы" Несмотря на богатый арсенал численных методов, разработанных для решения задач оптимального управления, алгоритмическое и программное оснащение этих задач существенно уступает современному программному обеспечению задач линейного и нелинейного программирования. Лишь для наиболее простых классов задач, в которых нет ограничений на фазовые координаты, построены достаточно эффективные алгоритмы, осуществляющие поиск управлений, удовлетворяющих необходимым условиям оптимальности. Эти алгоритмы, как правило, основаны на применении градиентных процедур или принципа максимума и допускают простую программную реализацию. Применяя метод штрафных функций или модифицированную функцию Лагранжа, с помощью этих алгоритмов можно получить решение некоторых задач и с фазовыми ограничениями, например с условиями на правом конце. Однако такой способ не всегда эффективен, поскольку требует многократного решения задачи при различных значениях параметров и далеко не всегда позволяет получить управление, на котором с заданной точностью выполнялись бы условия оптимальности и ограничения задачи. [c.191] Введем в рассмотрение функцию Я(ф, j , ы, ) 0. [c.192] Здесь u = и /) — управление, полученное на й-й итерации х (/) и ф (i) — соответствующие решения систем (4.3.1) и (4.3.3). [c.193] Управление, удовлетворяющее условию (4.3.4), можно найти с помощью следующей итерационной процедуры, сходимость которой доказана в [75]. Пусть задано допустимое управление u (i), t T. Пола гая A= 1, заполним таблицу значений управления u t) на равномерной сетке о, + К, + 2Л,. .., to- - Nh = = 1, где h — шаг интегрирования. [c.193] В каждом из алгоритмов А, Б, В, сходимость обеспечивается выбором параметра е . Определение точного значения этого параметра дается ценой значительных затрат процессорного времени, так как при каждом пробном значении е строится управление, интегрируется система (4.3.1) и вычисляется значение функционала (4.3.2). Поэтому работу процедуры одновременного поиска следует прекращать как при достижении точности по е, так и при получении меньшего значения функционала /(и ) /(и ). [c.194] Недостатком алгоритма А является медленная сходимость и чувствительность к локальным экстремумам. Для итерационных процессов Б и В характерно достаточно быстрое убывание функционала на первых итерациях и досрочное прекращение сходимости из-за эффекта прилипания управлений к границам. Восстановить сходимость можно, усилив точность выполнения операций алгоритма, уменьшив шаг интегрирования, точнее вычисляя границы Те и т. д. Однако, как показывает практика, в этом случае лучше перейти к алгоритму А, который даже при граничных значениях u t) и u (0 может построить внутреннее управление. [c.194] Для решения задачи линейного программирования (4.3.12) — (4.3.14) в [64] применяется специальная итерационная процедура, нестандартность которой заключается в том, что она требует задания такого набора векторов, выпуклая комбинация которых хорошо аппроксимировала бы множество допустимых вариаций OU. Кроме того, необходимо задание ограничений на коэффициенты линейной комбинации, аппроксимирующей вариацию управления ou t), i T. Значения этих коэффициентов определяют также окрестность управления u t), t .T, в которой линеаризованная задача (4.3.9) — (4.3.11) является допустимым приближением исходной задачи, т. е. линейные члены разложения функционала остаются главными. [c.196] Условия (4.3.17) заменим эквивалентной задачей у2( ,) — тш. [c.197] Учитывая определение множества D вместо (4.3.25) имеем л i. [c.198] Теперь перейдем к изложению алгоритма для решения задачи (4.3.24). Идея алгоритма состоит в том, что на каждой итерации решается задача i/ - -min не на всем множестве D, а на выпуклой оболочке его k точек ft г + 1. одной из которых является предыдущее приближение, а другие получены на итерациях как решения линейных задач, т. е. вычислены по формуле (4.3.28) при разных 6й, построенных по формуле (4.3.27) с различными векторами g. Обозначим через у , i = = 1,2,. .., S, точки из D, на выпуклой оболочке которых будем искать точку с минимальной нормой, а через а,- и i, i = I, ky k s, — коэффициенты выпуклой комбинации, с помощью которых представляются старое и новое приближения, соответственно. [c.198] Рассмотрим теперь общую схему для решения поставленной задачи с терминальными условиями (4.3.6). Пусть задано некоторое управление и (О, удовлетворяющее ограничениям w (i ) и, t G Т. Полагаем k= I. [c.200] Если /(и - - ) /(и ), то повторим алгоритм с начала. Данная схема включает несколько параметров т], у, а, улучшающих сходимость процесса. Автоматический режим решения задачи предполагает подбор необходимых значений этих параметров, например методом деления пополам, и поэтому требует больших ресурсов процессорного времени. При решении задачи в диалоговом режиме этот процесс можно существенно ускорить, меняя значения параметров в зависимости от результатов предыдущего испытания. [c.200] Матрица В квадратная, неособенная и соответствует обычной базисной матрице симплекс-метода 5 — матрица размера /иХ 5, где О 5 л — т, и связанные с ней переменные х называются супербазисными. Небазисные переменные Х] г, как и в симплекс-методе, принимают значения, равные одной из своих границ. [c.201] Нетрудно показать, что оптимальное решение задачи, описываемой соотношениями (4.3.29) —(4.3.31), существует при некотором 5 л. (Например, положим все переменные, являющиеся аргументами нелинейных функций, равными их оптимальным значениям.) Поэтому мы стараемся сохранить 5 по возможности небольшим и действуем способом, аналогичным симплекс-методу. [c.201] Имеют место два подходящих свойства шага Ах при переходе от X к Ах. [c.201] Градиент целевой функции в точке х+Ах задается левой частью равенства (4.3.34), если х достаточно близко к х + Ах в том смысле, что квадратичная аппроксимация является адекватной. Для того чтобы X + Ах было точкой локального оптимума на текущем множестве активных ограничений, потребуем, чтобы градиент целевой функции был в этой точке ортогонален поверхности, образованной активными ограничениями. Это означает, что проекция вектора градиента на эту поверхность равна нулю и дальнейшие передвижения не приведут к улучшению. Для того чтобы вектор градиента был ортогонален поверхности, образованной ограничениями-неравенствами, он долл ен представлять собой линейную комбинацию нормалей к этим ограничениям эти нормали задаются правой частью равенства (4.3.34), Я, и л называются множителями Лагранжа. [c.202] Это означает, что мы можем работать с вектором Ах (размерности 8, которую поддерживаем малой) и генерировать остальную часть Ах по мере необходимости. [c.202] Вектор X аналогичен вектору относительных оценок в симплекс-методе. [c.203] Шаг 1 (проверка на сходимость в текущем подпространстве). [c.204] Вернуться к основной статье