Оптимальные множители сходимости, обеспечивающие подавление эффекта Гиббса. Часть 2
Все статьи цикла:
- Оптимальные множители сходимости, обеспечивающие подавление эффекта Гиббса. Часть 1
- Оптимальные множители сходимости, обеспечивающие подавление эффекта Гиббса. Часть 2
Постановка задачи формирования оптимальных множителей сходимости
Описанные в предыдущей части статьи [1] множители сходимости на основе конечных последовательностей являются обобщением известных множителей сходимости Дирихле. Эти последовательности имеют ряд независимых параметров, варьируя которые (с учетом реальных ограничений) можно найти и построить оптимальные множители при тех или иных критериях оптимальности.
В этой части статьи на основе математической модели множителей, формируемых на базе конечных последовательностей множителей Дирихле, рассматривается задача построения целевой функции. При этом оптимизируемый множитель, сформированный в виде конечной последовательности множителей Дирихле, является множителем с ограниченной энергией, то есть функция, описывающая его, интегрируется в квадрате на вещественной оси. Кроме того, множитель имеет Фурье-образ, который с заданной точностью можно считать финитным.
Множители, обладающие указанными свойствами, принадлежат пространству, наделенному своими свойствами и метрикой. В соответствии с теоремой Винера-Пэли [2] это пространство при соблюдении некоторых условий может быть продолжено и в комплексную область. Задача построения оптимального множителя сходимости в этом случае будет сводиться к выбору из пространства с заданными характеристиками некоторой функции с параметрами, удовлетворяющими сформулированным требованиям. Для достижения результата, который считается в определенном смысле оптимальным, необходимо выполнение ряда условий [3, 4].
Во-первых, требуется установить границы вариабельности параметров системы, представляющей собой множитель сходимости на основе конечной последовательности множителей Дирихле.
Во-вторых, наличие критерия оптимальности, то есть функционала, значение которого характеризует качество на допустимом множестве его изменения. Поиск экстремума осуществляется по всей совокупности варьируемых параметров с целью построения множителя сходимости, отвечающего заданному критерию оптимальности. При этом необходимо выбрать только независимые внутрисистемные варьируемые параметры, учитывающие всю полноту взаимосвязей между переменными. Перечисленная совокупность признаков и действий составляет содержание постановочной части оптимизационной задачи. Таким образом, оптимизационная задача должна включать в себя описание:
- целевой функции;
- системы ограничений, устанавливающих соотношения между переменными в виде неравенств или равенств;
- диапазоны изменения предельных условий варьируемых параметров.
Решение оптимизационной задачи, которое будет получено с учетом системы ограничений, считается допустимым.
Сформулируем оптимизационную задачу в самом общем виде на основе нескольких возможных критериев оптимальности. Пусть имеется некоторая ограниченная во времени последовательность множителей сходимости Дирихле. Каковы должны быть амплитудновременные соотношения между множителями Дирихле, их длительность и система ограничений, чтобы совокупный спектр оптимизируемого множителя сходимости отвечал требованиям, представленным в таблице?
Тип по порядку |
Требования к выбору параметров |
---|---|
a | Минимизация мощности спектральных составляющих за пределами некоторой частоты |
b | Максимизация энергии спектра в заданной полосе частот |
c | Приближение формы спектральной характеристики к заданной с установленной точностью, при ограничении на величину мощности спектра за пределами некоторой частоты |
d | Максимизация скорости убывания мощности спектральных составляющих за пределами некоторой заданной частоты |
e | Минимизация ширины главного лепестка спектральной функции при заданном уровне мощности спектральных составляющих за пределами некоторой частоты |
Все сформулированные критерии оптимальности могут быть использованы для решения на основе единого подхода. В приведенном далее материале в полном объеме рассматривается только оптимизационная задача для критерия типа «а» (таблица), как наиболее отвечающая сформулированным целям исследований в данной работе. Для ее решения необходимо найти в некотором пространстве с заданными свойствами функцию с параметрами, обеспечивающими минимальность мощности спектральных составляющих оптимизируемого множителя за пределами заданной полосы частот.
Как следует из общей формулировки, рассматриваемая задача является задачей условной оптимизации. Минимизируемая функция этого вида относится к классу энергетических функций, которой отвечает среднеквадратический критерий минимизации.
Формализация оптимизационной задачи при ее постановке требует конкретизации особенностей множества, на котором будет решаться данная задача. Для этого введем и опишем некоторые ее свойства.
Определение [5]. Линейным нормированным пространством называется такое линейное пространство E, в котором каждому элементу x ∈ E поставлено в соответствие действительное число || x ||, называемое нормой элемента x, для которого выполняются следующие условия:
- || x || ≥ 0 и || x || = 0 тогда и только тогда, когда x = 0.
- || λ × x || = | λ | ∈ || x ||.
- || x + y || ≤ || x ||+|| y || для любых x, y ∈ E и любого действительного числа λ.
В линейном нормированном пространстве E расстояние между любыми его точками может быть определено по-разному. В изучаемом нами случае, когда используется подход, основанный на минимизации энергии ошибки, применен среднеквадратический критерий близости элементов конечномерного пространства En, при котором норма определяется соотношением:
где x = { x1, …, xn}. Упорядоченные последовательности из n действительных чисел (вектор-строк из n чисел) образуют пространство En, которое в данном случае является векторным. Если, кроме того, в нем определить некоторым образом расстояние между любыми его двумя элементами, то пространство становится метрическим. Введем расстояние ρ ( x, y ) между двумя точками пространства x = { x1, …, xn} и y = { y1, …, yn}, то есть получим:
Отметим одно важное обстоятельство. Метрика, введенная для пространства Enна базе множества Rnупорядоченных последовательностей n действительных чисел, может быть также использована и распространена на множество Cnпоследовательностей комплексных n чисел. При этом вычисление модуля необходимо производить в соответствии с правилами, используемыми при работе с комплексными числами.
Конкретизируем понятие оптимальности для евклидова пространства. Вектор x* = [ x1*, …, xn*]T∈ En, удовлетворяющий условию I ( x*) ≤ I ( x ) ∀ x ∈ G, называется оптимальной точкой функции I ( x ). Множество G учитывает все ограничения и условия и определяется m линейными и (или) нелинейными ограничениями в виде равенств:
и q линейными и (или) нелинейными ограничениями в виде неравенств:
Значение функции или функционала I ( x*) в этой точке называют оптимальным. Пара x* и I ( x*) составляет оптимальное решение.
Оптимизируемая функция может оказаться мультимодальной, поэтому могут иметь место различные типы оптимальных решений. Глобальное оптимальное решение удовлетворяет неравенству:
Для локального (или относительного) оптимального решения наименьшее значение I ( x*) достигается по отношению к ξ-окрестности M ( x*, ξ ) точки x*: I ( x*) ≤ I ( x ) ∀ x ∈ M ( x*, ξ ). Если, кроме того, принять во внимание точность нахождения искомого решения при использовании численных методов решения оптимизационной задачи, то I ( x*) определяется с точностью до величины γ, характеризующей различные источники ошибок.
Следует отметить, что изучение этих источников ошибок в случае применения численных методов решения оптимизационной задачи и связанных, как правило, с использованием тех или иных методов поиска оптимального решения, не является предметом настоящей работы.
Все алгоритмы поиска решения, будь то численные или аналитические, не учитывающие конкретных свойств целевой функции и системы ограничений, позволяют найти лишь локально-оптимальное решение, так как на каждом этапе поиска решения при движении в направлении к x* они в основном зависят от их локальных свойств. На практике нахождение глобального оптимума, например, может быть осуществлено при реализации процедуры поиска в достаточно широком диапазоне изменения значений вектора x. Однако сходимость процесса к точке оптимизации при этом не может быть гарантирована без дополнительных сведений, как о целевой функции, так и о системе ограничений. Предположение о том, что локальный экстремум является глобальным, может быть также проверено и путем использования нескольких начальных векторов, но при этом, даже если найдено единственное решение, все равно в общем случае его нельзя будет считать точкой глобального оптимума. Для подтверждения или опровержения таких выводов необходимо проведение дополнительного анализа свойств целевой функции, ее поведения с учетом всех существующих ограничений. Вместе с тем, на практике достаточно часто в задачах, отвечающих реальным физическим моделям и процессам, целевая функция обычно является «хорошей» и обладает единственным экстремумом. Поэтому для большинства практических целей использование численных процедур гарантированно приводит к локальному оптимуму и потому не является существенным недостатком. Не последнее место в оценке полученных результатов играют интуиция исследователя и понимание сути предметной области. Проводимые исследования в данной работе опираются на соответствующий математический аппарат и анализ свойств целевой функции и системы ограничений [6].
В общей формулировке оптимизационную задачу в пространстве En запишем в виде следующих соотношений [6]:
где I ( x ), x ∈ En минимизируемая функция или функционал.
В выражении (1) приняты обозначения: I ( x ) целевая функция, минимум которой должен быть найден при наличии ограничений gi( x ) ≤ bi на функциональные зависимости между переменными оптимизации xj. Константы di и Di задают диапазон их изменения. Размерность оптимизационной задачи определяется числом переменных m и числом ограничений q. Необходимое условие существования решения задачи оптимизации состоит в том, чтобы выполнялось неравенство m < q.
Исходя из общей формулировки задачи оптимизации вида (1), построим целевую функцию. Так как изучаемая задача сводится к необходимости нахождения вектора параметров, который обеспечивает минимум мощности спектральных составляющих за пределами заданной частоты ωmax спектра множителя сходимости, то целевая функция является функцией, а вектор, обеспечивающий такое решение, оптимален.
Множитель сходимости на основе конечной последовательности множителей Дирихле обозначим как s ( t ). По определению его спектр:
И соответственно энергетический спектр отвечает выражению:
где S*( ω ) комплексно-сопряженная функция S ( ω ).
Несколько видоизменим модель изучаемого множителя сходимости s ( t ), то есть будем считать, что он симметричен относительно нулевого отсчета времени и продолжен в область отрицательных значений. Эти упрощения не снижают общности дальнейших результатов.
Симметричность множителя относительно нулевого отсчета времени приводит к тому, что его спектр S ( ω ) вещественен. Тогда
или в развернутом виде:
Выражение (2) характеризует полную энергию множителя сходимости, сформированного на основе конечной последовательности множителей сходимости Дирихле. Поскольку задачей является минимизация функции, отвечающей критерию минимальности энергии спектральных составляющих вне заданного диапазона частот, то есть за частотой ω0, то целевую функцию представим в виде:
где s вектор оптимизируемых параметров, определяемых свойствами и описанием формируемого множителя сходимости на основе конечной последовательности множителей Дирихле s ( t ).
Учитывая свойства симметрии спектральной характеристики относительно оси ординат, последнее выражение перепишем так:
Полученное соотношение является общим, описывает целевую функцию для всех возможных типов множителей сходимости на основе конечной последовательности множителей Дирихле, и оно применимо для решения оптимизационных задач. Таким образом, оптимальные параметры могут быть найдены из условия:
Целевая функция вида (3) в явном виде не содержит в себе параметры вектора оптимизации. Конкретизируем тип оптимизируемого множителя сходимости и приведем ряд примеров построения целевых функций при использовании того или иного типа множителя.
Пример 1
Определим целевую функцию для множителя сходимости на основе конечной последовательности множителей Дирихле с различными амплитудами. Воспользуемся для этого выражением (см. часть 1, формула (3)):
С его учетом целевая функция будет иметь вид (5).
Минимум этой функции позволяет найти параметры оптимизации Δt1, mi, μi, τi для числа множителей Дирихле в последовательности, равном i, где i ∈ 1, k.
Пример 2
Определим целевую функцию для множителя сходимости на основе конечной последовательности множителей Дирихле с одинаковыми амплитудами.
Спектральная характеристика множителя сходимости в этом случае описывается соотношением (6).
Параметры оптимизации Δt1, μi, τi.
Замечание. Использование отрицательных индексов у варьируемых параметров целевой функции обусловлено только удобством математической записи. Приняты условия, а именно: mi = mi, τi = τi, и μi = μi. Их введение обусловлено симметричностью расположения как самих множителей сходимости Дирихле во временной области, так и их спектральных характеристик.
Основным показателем качества решения оптимизационной задачи является достижение глобального минимума целевой функции. В рассматриваемом случае это минимум энергии спектральных составляющих множителя сходимости за пределами заданной частоты ω0. Решение ищем по всей совокупности параметров оптимизации, то есть Δt1, mi, μi, τi. Эти параметры имеют определенные диапазоны вариабельности, определяемые исходя из физических соображений и представляемые в виде ограничений типа неравенств. Некоторые из них очевидны, а другие могут быть получены из анализа модели множителя сходимости, как во временной, так и в частотной областях, и сути метода построения этого множителя. Рассмотрим эти ограничения подробнее.
Первая группа ограничений очевидна. К ней относятся неравенства:
Они вытекают из общей постановки задачи.
Вторая группа связывается с самим методом формирования конечных последовательностей множителей сходимости Дирихле. Рассмотрим ее подробнее.
Реализации метода построения множителей сходимости с различными или равноамплитудными множителями сходимости Дирихле на основе конечных последовательностей показывает, что наибольшее число варьируемых параметров, подлежащих оптимизации, у множителей сходимости с различными амплитудами в последовательности. Целевая функция для этого типа множителя имеет наиболее общее выражение, поэтому и будет изучена более детально.
С учетом принятой нами симметричной модели формируемого множителя сходимости последовательность множителей Дирихле состоит из центрального (базового) множителя и ряда дополнительных (вспомогательных) множителей Дирихле, находящихся справа и слева от него. Амплитуду, длительность и сдвиг вспомогательных множителей выбирают, исходя из условия подавления боковых лепестков спектральной характеристики центрального множителя Дирихле. Временной сдвиг первых вспомогательных множителей, находящихся справа и слева от центрального множителя, должен быть таков, чтобы главные лепестки их спектральных характеристик были смещены по фазе. При этом необходимо, чтобы они находились в противофазе с первыми минимумами спектральной характеристики центрального множителя. Например, если длительность центрального множителя Дирихле Δt1, а амплитуда равна единице, то амплитуды первых минимумов спектральной характеристики составляют около 20% амплитуды главного лепестка спектральной характеристики. Сами же минимумы находятся в интервалах ±[2 π / Δt1, 2(2 π / Δt1)]. Отметим, что установить точное положение минимумов спектральной характеристики центрального множителя Дирихле затруднительно, ввиду того, что на них влияют спектральные составляющие всех вспомогательных множителей, находящиеся непосредственно в той и другой полуплоскости частот.
Амплитуды главных лепестков спектральной характеристики вспомогательных множителей должны быть приближенно равны амплитудам первых минимумов спектральной характеристики центрального множителя. Кроме того, необходимо учитывать, что амплитуды лепестков спектральной характеристики главного множителя убывают асимптотически, как O(1/ ω ). Отсюда следует, что должно выполняться неравенство mi > mi+1. Следует также отметить, что амплитуды главных лепестков спектральных характеристик вспомогательных множителей во временной области определяются и их длительностями.
На основании проведенных рассуждений следует, что длительности вспомогательных множителей, по мере удаления их от центрального множителя Дирихле, должны уменьшаться, так как минимумы его спектральной характеристики убывают со скоростью O(1/ ω ). Таким образом, ограничения для длительностей вспомогательных множителей сходимости типа Дирихле имеют вид:
или в эквивалентной форме:
причем μ0 = Δt1/ t1 = 1. Кроме того, временные сдвиги для вспомогательных множителей Дирихле должны подчиняться неравенствам типа:
Неравенства, ограничивающие диапазон вариабельности величин временного сдвига для вспомогательных множителей, записываются так:
Число неравенств типа (8) ограничено числом вспомогательных множителей Дирихле последовательности k.
Построение целевой функции, введение системы неравенств и ограничений составляют суть оптимизационной задачи. Однако нет гарантии, что процесс оптимизации будет сходящимся. Поэтому следует установить необходимые и достаточные условия нахождения минимума функции по совокупности параметров, обеспечивающих формирование оптимального множителя сходимости. Необходимо установить также, будет ли найденная точка оптимума локальной или глобальной.
Общее решение задачиформирования оптимального множителя сходимости и ее анализ
Авторы сформулировали задачу оптимизации параметров множителя сходимости, являющегося обобщением множителя сходимости Дирихле. Была построена целевая функция и введена система ограничений. Наличие ограничений указывает на то, что данная задача классифицируется как задача условной оптимизации. Существуют два основных подхода для ее решения.
Во-первых, подход, основанный на преобразовании задачи условной оптимизации в задачу безусловной оптимизации. В качестве метода преобразования обычно используют метод множителей Лагранжа, а само решение задачи проводится по стандартной схеме, определяемой принципом Лагранжа.
Во-вторых, это метод, основанный на применении теоремы Куна и Таккера и проверке условий возможности ее применения [6]. При этом преобразовывать задачу условной оптимизации в задачу безусловной не нужно. Использование любого из этих подходов при поиске решения требует выполнения следующих этапов.
Формализации оптимизационной задачи, построения целевой функции и системы ограничений
Приведены результаты, полученные в виде выражений для целевых функций (3) и (4). Представлены целевые функции для тех или иных типов множителей сходимости в виде соотношений (5) и (6). Система ограничений на оптимизируемые параметры в виде неравенств отражается выражениями (7, 8).
Исключение избыточных ограничений и проверка их совместимости
Ограничения в виде неравенств в задачах условной оптимизации играют существенную роль. При значительном их числе поиск решения усложняется, поэтому одним из методов упрощения решения оптимизационной задачи является устранение избыточных ограничений. Избыточным является ограничение, которое не используется при определении границ допустимой области значений варьируемых переменных.
Проанализируем систему ограничений оптимизационной задачи. Рассмотрим условие положительности μi. По определению μi = Δt1/ ti. С учетом определения длительности множителей сходимости Δti > 0 всегда. Из этого следует, что ограничение вида μi >0 избыточно и потому может быть исключено из данной задачи. Кроме того, из общей постановки видно, что mi > 0. С учетом же того, что величина максимума центрального лепестка спектральной характеристики определяется амплитудой множителя Дирихле и его длительностью, то для компенсации боковых максимумов (минимумов) спектра, уменьшающихся по своей величине как O(1/ ω ), следует, что необходимо выполнение неравенств:
Воспользуемся определением для коэффициента μi и запишем систему ограничивающих неравенств в виде:
Симметричность оптимизируемого множителя сходимости относительно нулевого отсчета времени и наличие более жесткого ограничения вида (8), позволяют считать ограничение τi > 0 избыточным. Это также не противоречит определению понятия временного сдвига.
Таким образом, общая совокупность ограничений сводится к неравенствам вида (8), (9) и (10). Отметим также, что они не противоречивы и совместимы.
Пример 3
Установим ограничения для множителя сходимости на основе конечной последовательности множителей Дирихле с различными амплитудами при значении k = 3.
Для данного примера условно примем длительность Δt1 и амплитуду центрального множителя последовательности, равной единице. С учетом определения параметра miследует, что m0 = 1. Заметим также, что μ0 = 1. Поэтому неравенство (9) запишем следующим образом: 1 > Δt2m1. Ограничения типа (8) и (10) в данном случае приобретают вид 0 < τ1 <2 π, μ0 = 1, μ0 >μ1.
Пример 4
Установим ограничения для множителя сходимости на основе конечной последовательности множителей Дирихле с одинаковыми амплитудами при значении k = 3.
При анализе множителя сходимости на основе конечной последовательности множителей Дирихле с одинаковыми амплитудами можно условно принять их амплитуду равной единице, поэтому m1 = m2 = 1, ввиду чего неравенство (9) представляется так: Δt2 <1. Длительность центрального множителя в последовательности Δt1 примем равной единице. С учетом принятых свойств модели другие неравенства имеют аналогичный вид, то есть 0 < τ1 <2 π, μ0 = 1, μ0 >μ1.
Замечание 1. Односторонние неравенства могут быть легко преобразованы в двусторонние и наоборот, двусторонние неравенства также могут быть преобразованы в систему односторонних неравенств.
Замечание 2. Из общей постановки оптимизационной задачи вида (1) ясно, что в ней могут содержаться линейные или нелинейные ограничения типа равенств. В приведенных двух примерах формирования ограничений для множителей сходимости на основе конечной последовательности множителей Дирихле, как с одинаковыми амплитудами, так и различными, заданы ограничения типа равенств. При этом возникает естественный вопрос: «Являются ли они действительно ограничениями?» Ответом на него служит утверждение: эти равенства не являются ограничениями ввиду того, что в целевой функции эти параметры будут заданными.
Преобразование системы ограничений типа неравенств в равенства
Необходимость преобразования ограничений типа неравенств обусловлена требованиями применимости метода неопределенных множителей Лагранжа к сформулированной оптимизационной задаче. Метод требует преобразования ограничений типа неравенств в ограничения типа равенств [6].
Для осуществления преобразования введем в каждое из неравенств дополнительную неотрицательную переменную, дополняющую неравенство до равенства. При этом целевая функция не изменится, так как весовые множители, с которыми эти дополнительные переменные входят в нее, имеют нулевые значения. Представление оптимизационной задачи в таком модифицированном виде, то есть как задачи безусловной оптимизации в виде функции Лагранжа, требует решения системы уравнении, получаемой на основе определения частных производных от нее и нахождение искомых множителей. Применение принципа Лагранжа, в соответствии с которым экстремум функции в задаче с ограничениями совпадает с экстремумом функции задачи без ограничений, позволяет найти стационарные точки путем решения сформированной системы уравнений.
Для нахождения множителей Лагранжа требуется наличие у модифицированной (то есть самой целевой функции с системой ограничений) целевой функции некоторых дополнительных свойств [7].
Во-первых, ее непрерывность, то есть наличие частных производных, как по всем искомым варьируемым параметрам, так и по множителям Лагранжа. Из анализа целевых функций, отвечающих выражениям (5) и (6), видно, что они непрерывны и потому имеют частные производные. Что касается непрерывности производных по множителям Лагранжа, которые формируются с учетом выражений (810), то их находят как производные от аддитивной части модифицированной целевой функции, являющейся линейной функцией. Проблема в другом: полученная после дифференцирования система уравнений содержит в себе нелинейные уравнения. Поэтому аналитически множители Лагранжа не могут быть найдены. Их нахождение может быть осуществлено только приближенно с использованием численных методов решения нелинейных уравнений.
Во-вторых, если даже система уравнений и была бы линейной, то найденные аналитически множители Лагранжа не решают проблемы решений задачи нахождения оптимальных параметров в целом. Связано это с тем, что совершенно не очевидно, достигается ли при этом экстремум функции. А если даже это и его экстремаль, то является ли она точкой минимума в области, задаваемой системой ограничений. Для этого необходимо использовать общие критерии, обеспечивающие проверку условий достижения минимума функции в заданной области.
Указанные критерии основываются на исследовании первого и второго дифференциала функции. В теории решения оптимизационных задач доказаны следующие теоремы, устанавливающие необходимые и достаточные условия экстремума [8], суть которых сводится к следующему:
- Для того чтобы дифференцируемая функция I ( x ) достигала в точке x* экстремума, необходимо, чтобы ее дифференциал в этой точке равнялся нулю, то есть δI ( x*) = 0.
- Для того чтобы функция I ( x ), имеющая в окрестности точки x* непрерывную вторую производную, достигала в точке x* минимума, достаточно, чтобы δ2I ( x*) ≥ 0.
Сформулированные необходимые и достаточные условия существования минимума функции требуют также решения нелинейных уравнений и исследования второго дифференциала функции. Это путь, дающий гарантии того, что оптимизационная задача имеет единственное решение в области, определяемой системой ограничений, и обеспечивает нахождение вектора оптимальных параметров.
Представим целевую функцию, отвечающую выражению (7) в виде:
где S ( s, ω ) спектральная характеристика множителя сходимости с вектором параметров s.
Для ее минимизации необходимо, чтобы траектория оптимального решения удовлетворяла ограничениям вида (810), которые должны быть преобразованы в ограничения типа равенств. Кроме того, S ( s, ω ) должна быть непрерывна и иметь производные первого порядка по всем переменным.
Для преобразования двустороннего ограничения (8) в равенство введем новые переменные состояния αi, удовлетворяющие уравнениям:
Уравнение (12) эквивалентно (8), так как для того, чтобы существовало αi, нужно, чтобы было справедливо (12) и наоборот.
Преобразуем уравнение (12) к виду:
и обозначим через A ( τ, α ) левую часть последнего уравнения. Запишем:
Аналогичным образом преобразуем неравенства типа (9) в равенства. Введем новую переменную βi. Перепишем неравенства (9) в виде системы неравенств Δti1mi1 > Δtimi, ∀ i ∈ 2, k. С учетом новой переменной β последнюю систему неравенств представим в виде системы равенств, то есть:
Левую часть уравнения (13) обозначим так:
Преобразуем неравенства (10). Для этого введем переменную γi и запишем:
И обозначим через
Исходная задача условной оптимизации преобразована и не содержит ограничений типа неравенств. Введение новых параметров привело к тому, что число оптимизируемых параметров увеличилось на величину 2 k 2. Ограничения типа равенств (1214) могут быть включены в целевую функцию (11) с использованием множителей Лагранжа.
Рассмотрим допустимые диапазоны изменения переменных оптимизационной задачи. Функция (11) определена на полуоткрытом интервале [ ω0,+ ∞ ). В качестве граничных условий выступают фиксированная точка ω0и подвижная точка ω∞→∞. Значение
а S( s, ω0) не определено, но конечно. Таким образом, экстремали решения оптимизационной задачи в начальной точке ω0не фиксированы. Вторая граничная точка такова, что при ω→ + ∞ все экстремали асимптотически стремятся к нулю [6].
Выполненные этапы преобразования для перехода от задачи условной оптимизации к задаче безусловной оптимизации позволяют представить модифицированную целевую функцию в следующем виде:
Здесь использованы следующие обозначения:
- x обобщенный вектор оптимизируемых параметров, представляемый как xT = [ τ, Δt, m, μ, α, β, γ ];
- A ( τ, α ) вектор оптимизируемых параметров сдвига τiпри i = 1, k и параметра τi, введенного при преобразовании двустороннего неравенства в уравнение;
- B ( Δt, m, β ) вектор оптимизируемых параметров длительностей вспомогательных множителей сходимости Дирихле и их амплитуд, а βi ∀ i ∈ 2, k элемент вектора, введенный при преобразовании условия-неравенства в уравнение;
- Г ( μ, γ ) вектор соотношений амплитуд вспомогательных множителей сходимости Дирихле к базовому и γi его компонента, как результат преобразования условия-неравенства в уравнение.
Подынтегральную функцию в выражении (15) обозначим через Ф, то есть
+ λT1 [ A ( τ )]+ λT2 [ B ( Δt, m )]+ λT3 [ Г ( μ )].
Решением оптимизационной задачи является функция, доставляющая экстремум функции (11), при наличии условий (1214) и она удовлетворяет, при соответствующем выборе множителей λ j ∈ j = 1, 3, системе уравнений Эйлера-Лагранжа, составленным для функции (15).
Отметим важное обстоятельство. Ни в уравнениях связи, ни в подынтегральной функции (11) не присутствуют производные от функций. Это обстоятельство существенно упрощает систему уравнений Эйлера, которая в данном случае такова:
Искомая функция с оптимальными параметрами определяется как решение системы уравнений Эйлера вида (16) и системы уравнений:
Решение этой объединенной системы конечных, недифференциальных уравнений не содержит элементов произвола и поэтому, вообще говоря, может и не удовлетворять граничным условиям. Экстремум может достигаться в том случае, когда кривая (16) проходит через граничные точки. Однако, ввиду того, что в граничных точках значение функции не закреплено, это дает основание предполагать наличие экстремума у исследуемой функции [6].
Проведенные преобразования задачи условной оптимизации перевели исходную задачу к двухточечной краевой задаче безусловной оптимизации.
Многомерность задачи определения компонент вектора λ j, полученных на основе решения уравнения Эйлера-Лагранжа, позволяет только обозначить путь нахождения аналитического решения. В случае если даже часть уравнений системы будет иметь нелинейный характер, то такой подход становится неприемлемым.
Пример 5
Оптимизационная задача для множителя сходимости на основе множителей Дирихле с различными амплитудами.
Число множителей сходимости Дирихле в последовательности k = 3. Другие исходные данные аналогичны данным примера 3. В нем установлены значения m0 = 1 и Δt1 = 1. Таким образом, оптимизационными параметрами являются только m1, μ1, τ1.
В рассматриваемом случае оптимизируемая функция имеет вид (18), а с учетом известных и фиксированных параметров, функция Ф принимает следующий вид (19).
После нахождения частных производных по аргументам m1, μ1, τ1, получаем систему из трех нелинейных уравнений. Аналитическое решение отсутствует. Оно может быть найдено приближенно, в виде некоторых оценок, или численно.
Определение неизвестных коэффициентов λ1, λ2, λ3 осуществляется приведением уравнений (17) в соответствии с исходными данными рассматриваемого примера и условий трансверсальности. Так как начальное краевое значение для точки ω0не фиксировано, то задача относится к задаче с подвижными границами. Значение функции на прямой ω = ω0не фиксировано. Вторая краевая точка имеет фиксированное значение, то есть
и потому может использоваться как дополнительное условие трансверсальности для нахождения конкретных значений вектора λ.
Можно привести примеры и для других типов множителей сходимости. Однако получаемые уравнения Эйлера-Лагранжа нелинейные и аналитического решения не имеют. Таким образом, сформулированная оптимизационная задача аналитически не может быть решена. Ее решения необходимо искать, пользуясь прямыми численными методами, которые достаточно полно освещены в [9].
Алгоритмы формирования оптимальных множителей сходимости
Описанный метод построения множителей сходимости на основе конечных последовательностей множителей Дирихле и его реализации, позволяет записать алгоритмы их формирования. Следует отметить, что поскольку решить поставленную задачу условной оптимизации аналитически не удалось, то используются прямые численные методы. Они являются одним из инструментов решения задач с ограничениями, как в виде равенств, так и неравенств, для таких широко используемых в теоретических исследованиях и инженерных расчетах математических пакетов, как MatCad и LabVIEW. В описании этих математических пакетов дается обоснование сходимости численных методов, используемых в них для решения оптимизационных задач и их точности. Кроме того, они не требуют преобразования ограничений типа неравенств в равенства и приведения задачи к задаче безусловной оптимизации. Все это реализовано в виде надежно работающих процедур и программ. Для завершенности проводимого исследования ниже приведено описание алгоритмов формирования оптимальных множителей сходимости на базе конечной последовательности окон Дирихле.
Алгоритм формирования оптимальных множителей в случае использования конечной последовательности множителей сходимости Дирихле с различными амплитудами приведен в алгоритме 1 применительно к критерию типа «а» из таблицы.
Необходимые пояснения. Алгоритм осуществляет нахождение оптимальных множителей на основе конечной последовательности множителей Дирихле на интервале оптимизации [ ω0, ∞ ), отправляясь от некоторой начальной точки вектора оптимизируемых параметров. Полагаем m = m0, μ = μ0, τ = τ0. При этом необходимо учесть ограничения, накладываемые на искомые параметры в соответствии с выражениями (810).
В дополнение к описанному выше алгоритму отметим, что численные методы решения оптимизационных задач позволяют получить оптимальное решение, но не гарантируют, что это решение отвечает точке глобального оптимума. Одним из практических приемов, позволяющих проверить полученное решение на глобальность, является варьирование значений вектора начальных условий оптимизационной задачи.
Методика решения оптимизационной задачи не является в данной работе основным направлением исследований. Для нас важен результат, позволяющий найти оптимальные параметры описанного и предложенного нового типа множителей сходимости, обеспечивающего подавление проявлений эффекта Гиббса.
Алгоритм 1. Решение задачи определения оптимальных параметров множителей сходимости при использовании конечной последовательности множителей Дирихле с различными амплитудами
Вход
- Выбор критерия оптимизации (в соответствии с таблицей).
- Задание граничных точек и значений функции в них.
- Задание числа множителей сходимости Дирихле в последовательности n = n0.
- Фиксация не оптимизируемых параметров и присвоение им числовых значений.
- Задание значений вектора начального приближения: m = m0, μ = μ0, τ = τ0.
Выход
Числовые значения вектора оптимизируемых параметров: m = mopt, μ = μopt, τ = τopt.
Алгоритм
- Приведение выражения (5) для функции общего вида к виду, отвечающему числу заданных множителей сходимости типа Дирихле в последовательности.
- Преобразование ограничений типа неравенств вида (810) в равенства в соответствии с формулами преобразования (1214).
- Построение конкретной расширенной целевой функции на основе ее общего вида в соответствии с выражением (15).
- Нахождение уравнений Эйлера в соответствии с формулой (16).
- Построение уравнений ограничений на основе системы общего вида (17).
- Учет краевых точек и составление условий трансверсальности.
- Совместное решение системы уравнений Эйлера, уравнений ограничений и условий трансверсальности. Нахождение конкретных значений для вектора множителей Лагранжа и оптимальных параметров искомой оптимальной функции.
- Проверка корректности решения. Осуществляется проверка соответствия полученного решения граничным условиям.
- Вариация начального вектора исходных данных.
- Трансформация полученных нормированных значений оптимальных параметров к конкретным параметрам реальных множителей сходимости.
Замечание. а) Так как расширенная целевая функция не содержит производных, то система уравнений алгебраического типа и нелинейная. б) Нахождение аналитическими методами, как множителей Лагранжа, так и вектора искомых оптимальных параметров возможно только численными методами в силу нелинейности системы.
Оптимизационная задача для случая множителей сходимости при использовании конечной последовательности множителей Дирихле с различными амплитудами является наиболее общей. Поэтому описание алгоритма построения оптимальных множителей сходимости для случая использования окон Дирихле с равными амплитудами проведем на основе учета существующих отличий в решении оптимизационной задачи.
Рассмотрим в качестве следующего примера решения аналогичной задачи для множителей сходимости при использовании конечной последовательности множителей Дирихле с одинаковыми амплитудами. Представим его в виде алгоритма 2.
Алгоритм 2. Решение задачи определения оптимальных параметров множителей сходимости при использовании конечной последовательности множителей Дирихле с одинаковыми амплитудами
Вход
Исходные данные аналогичны данным алгоритма 1.
Замечание. Число фиксируемых параметров в данной оптимизационной задаче больше, и потому ее размерность ниже.
Выход
Выходные данные аналогичны данным алгоритма 1.
Алгоритм
- Приведение выражения функции общего вида (10) к виду, отвечающему числу заданных множителей Дирихле в последовательности.
- Прочие пункты аналогичны соответствующим пунктам описания в алгоритме 1.
Из сравнения представленных алгоритмов видно, что нахождение оптимальных параметров множителей сходимости при использовании конечной последовательности множителей Дирихле практически идентично. Их различие состоит в описании конкретных целевых функций, определяемых особенностями спектральных характеристик оптимизируемого множителя сходимости.
Выводы
Сформулирована задача синтеза оптимальных множителей сходимости, обеспечивающих эффективное подавление эффекта Гиббса, и сформирована система ограничений для решения оптимизационной задачи. Приведены примеры целевых функций для ее решения при различных начальных условиях.
Описаны алгоритмы решения оптимизационной задачи для формирования оптимальных множителей сходимости.
Литература
- Лиференко В., Сердюков Ю. Оптимальные множители сходимости, обеспечивающие подавление эффекта Гиббса. Часть 1 // Компоненты и технологии. 2009. № 1.
- Сиберт У. М. Цепи, сигналы, системы: В 2 ч. Ч. 1. // М.: Мир, 1988.
- Афанасьев В. М., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления // М.: Высшая школа,1989.
- Бакалов В. П. Основы теории цепей // 2-е изд. М.: Радио и связь, 2003.
- Ильин В. А., Садовничий В. А., Сендов Бл. Х. Математический анализ // М.: Наука, 1979.
- Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление // М.: Наука. 1974.
- Ванько В. Л., Ермошина О. В., Кувыркин Г. Н. Вариационное исчисление и оптимальное управление // М.: МГУ, 2001.
- Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа // М.: Наука, 1976.
- Васильев Ф. П. Численные методы решения экстремальных задач // М.: Наука, 1980.