Вариационное исчесление

Вариационное исчисление — это раздел математики, в котором изучаются вариации функционалов. Самая типичная задача вариационного исчисления состоит в том, чтобы найти функцию, на которой функционал достигает экстремального значения. Методы вариационного исчисления широко применяются в различных областях математики, в дифференциальной геометрии с их помощью ищут геодезические и минимальные поверхности. В физике вариационный метод — одно из мощнейших орудий получения уравнений движения (см. например Принцип наименьшего действия), как для дискретных, так и для распределённых систем, в том числе и для физических полей. Методы вариационного исчисления применимы и в статике (см. Вариационные принципы).

Важнейшими понятиями вариационного исчисления являются следующие:

вариация (первая вариация),
вариационная производная (первая вариационная производная),
кроме первой вариации и первой вариационной производной, рассматриваются и вариации и вариационные производные второго и высших порядков.

Никак не связана с вариационным вычислением совпадающая по названию вариация функции в анализе.

Термин варьирование (варьировать) — применяется в вариационном исчислении для обозначения нахождения вариации или вариационной производной (это аналог термина дифференцирование для случая бесконечномерного аргумента, являющегося предметом вариационного исчисления). Также нередко для краткости (особенно в приложениях) термин варьирование применяется для обозначения решения вариационной задачи, сводимой к нахождению вариационной производной и приравнивания её нулю.

Вариационная задача означает, как правило, нахождение функции (в рамках вариационного исчисления — уравнения на функцию), удовлетворяющей условию стационарности некоторого заданного функционала, то есть такой функции, (бесконечно малые) возмущения которой не вызывают изменения функционала по крайней мере в первом порядке малости. Также вариационной задачей называют тесно связанную с этим задачу нахождения функции (уравнения на функцию), на которой данный функционал достигает локального экстремума (во многом эта задача сводится к первой, иногда практически полностью). Обычно при таком употреблении терминов подразумевается, что задача решается методами вариационного исчисления.

Типичными примерами вариационной задачи являются изопериметрические задачи в геометрии и механике; в физике — задача нахождения уравнений поля из заданного вида действия для этого поля.

Содержание

1 История
2 Неформальное обсуждение
3 Уравнение Эйлера — Лагранжа
- 3.1 Вывод с использованием производной по направлению. Частный пример
- 3.2 Вывод с использованием производной по направлению. Более общий случай
4 Примечания
5 Литература
6 См. также

История

Одной из первых задач вариационного исчисления известных в истории была задача Дидоны. Другой исторической задачей вариационного исчисления, давшей толчок к развитию этого направления математики является задача о брахистохроне. Решающий вклад в развитие вариационного исчисления внесли Леонард Эйлер и Жозеф Лагранж, первому из которых принадлежит первое систематическое изложение вариационного исчисления и сам термин, второй же получил независимо многие основополагающие результаты и ввёл понятие вариации.

Неформальное обсуждение

Содержанием вариационного исчисления является обобщение понятия дифференциала и производной функции конечномерного векторного аргумента на случай функционала — функции, областью определения которой служит некое множество или пространство функций, а значения лежат в множестве вещественных чисел (иногда комплексных, что мало меняет что-то по существу).

Всюду ниже в этом параграфе подразумевается, что функции и функционалы обладают необходимой гладкостью, то есть вопрос существования тех или иных производных специально не рассматривается, тем более что во многих конкретных задачах этот вопрос не имеет практического значения (нужная гладкость заведомо есть).

Функционал $Φ[f]$ ставит в соответствие каждой конкретной функции $f$ из его области определения — определённое число.

Нетрудно написать для функционала аналоги дифференциала и производной по направлению.

Вариация

Аналогом дифференциала (первого дифференциала) является в вариационном исчислении вариация (первая вариация):

δΦ = Φ[f + δ f] - Φ[f]

(как и в случае дифференциала имеется в виду линейная часть этого приращения, а выражаясь традиционным образом — $δ f$ выбирается бесконечно малой, и при вычислении разности отбрасываются бесконечно малые высших порядков). При этом $δ f$ — играющее роль дифференциала или малого приращения независимой переменной — называется вариацией $f$ .

Как видим, $δΦ$ сама в свою очередь является функционалом, так как она, вообще говоря, различна для разных $f$ (также и при разных $δ f$ ).

Таким образом, это прямой аналог одномерного и конечномерного дифференциала:

d y = y (x + d x) - y (x)

— точно так же понимаемого как линейная часть приращения функции $y$ при бесконечно малом приращении аргумента $x$ (или линейный член при разложении $y$ по степеням $d x$ вблизи точки $x$ ).

Примеры

Для функционала $Φ[f] = cos(f (1))$ вещественной функции вещественного аргумента — для любой $f$ и $δ f$ будет верным $δΦ = - sin(f (1))$ .
Для функционала $Φ[f] = cos(f (1)) + sin(f (6))$ вещественной функции вещественного аргумента — для любой $f$ и $δ f$ будет верным $δΦ = - sin(f (1)) + cos(f (6))$ .
Для функционала $\Phi[f]=\int\limits_1^2 f(x)\,dx$ вещественной функции вещественного аргумента — для любой $f$ и $δ f$ будет верным $\delta\Phi=\int\limits_1^2(f(x)+\delta f(x))\,dx-\int\limits_1^2 f(x)\,dx=\int\limits_1^2\delta f(x)\,dx$ .

Производная по направлению

Производной функционала $Φ$ в точке $f$ по направлению $g$ очевидно, будет

$\frac{d\Phi[f+\alpha g]}{d\alpha}\bigg|_{\alpha=0}.$

Этого в принципе уже достаточно для решения типичной вариационной задачи — нахождения «стационарных точек», то есть таких функций $f$ , для которых первая вариация или производная по направлению обращается в ноль для любой бесконечно малой $δ f$ или любой конечной $g$ . Именно эти «точки» в пространстве функций — то есть именно такие функции — являются кандидатами в экстремали (проверку того, действительно ли они являются экстремалями, то есть достигается ли на них локальный экстремум, надо делать отдельно, как и в случае функций конечномерного аргумента; интересно, что во многих задачах физики важнее найти не экстремали, а именно стационарные точки).

Примеры

(Здесь не вводится специальных обозначений для производной по направлению.)

Производная функционала $Φ[f] = f (0)$ в точке $f = cos$ по направлению $g = cos$ равна $\frac{d(\cos(0)+\alpha\cos(0))}{d\alpha}=1$ .
Производная функционала $Φ[f] = f (0)$ в точке $f = cos$ по направлению $g = sin$ равна $\frac{d(\cos(0)+\alpha\sin(0))}{d\alpha}=0$ .
Производная функционала $\Phi[f]=\int\limits_0^{2\pi}\cos(x)f(x)\,dx$ в точке $f = cos$ по направлению $g = cos$ равна $\frac{d}{d\alpha}\left((1+\alpha)\int\limits_0^{2\pi}\cos^2x\,dx)\right)=\pi$ .
Производная функционала $\Phi[f]=\int\limits_0^{2\pi}\cos(x)f(x)\,dx$ в точке $f = cos$ по направлению $g = sin$ равна $\frac{d}{d\alpha}\left(\alpha\int\limits_0^{2\pi}\sin x\cos x\,dx\right)=\frac{d0}{d\alpha}=0$ .

Вариационная производная

Для интегральных функционалов, которые являются очень важным для математики и приложений случаем, можно ввести не только аналог дифференциала и производную по направлению, но и производную Фреше — аналог конечномерного (градиента), называемую вариационной производной.

То есть, в полной аналогии с конечномерным случаем, когда

$\vec{dy}=\big(\vec\nabla y,\;d\vec x\big)=\left(\frac{dy}{d\vec x},\;d\vec x\right)=\sum_i\partial_i y\,dx_i$ ,

где $\vec\nabla y$ — обозначение градиента (или производной Фреше) функции $y$ , а $(\;,\;)$ — скалярное произведение; $\partial_i$ — оператор частной производной по $i$ -той координате, сумма представляет собой полный дифференциал.

Для функционала имеем

$\delta\Phi=\left(\frac{\delta\Phi}{\delta f},\;\delta f\right)=\int\frac{\delta\Phi}{\delta f}(x)\delta f(x)\,dx$ ,

где $\frac{\delta\Phi}{\delta f}$ — обозначение вариационной производной $Φ$ , а суммирование конечномерной формулы естественно заменено интегрированием.

Итак,

$\frac{\delta\Phi}{\delta f}$ — стандартное обозначение вариационной производной. Это также некая функция как от

x

, как и

f

(вообще говоря, это обобщённая функция, но эта оговорка выходит за рамки рассмотрения, так как предполагается, что все функции и функционалы сколь угодно гладки и не имеют особенностей).

Иными словами, если можно представить вариацию

δΦ = Φ[f + δ f] - Φ[f]

в виде

$\delta\Phi=\int A(x)\delta f(x)\,dx$ , где

A

— некоторая функция

x

то $A$ есть вариационная производная $Φ$ по $f$ («по $f$ » здесь означает, что остальные аргументы или параметры не меняются; речевой оборот «по $f$ » можно опустить в случае, когда точно определено, функционалом от какой функции рассматривается $Φ$ , что на практике может быть не ясным из самой его формулы, в которую могут входить и другие параметры и функции — см. также ниже). То есть

$\frac{\delta\Phi}{\delta f} = A.$

Примеры

(В здесь разность интегралов сводится в один интеграл.)

Для функционала $\Phi[f]=\int\limits_1^2 f(x)\,dx$ имеем

$\delta\Phi=\delta\int\limits_1^2 f(x)\,dx=\delta\int\limits_1^2 \left(f(x)+\delta f(x)\right)\,dx-\delta\int\limits_1^2 f(x)\,dx=\int\limits_1^2 \delta f(x)\,dx \Rightarrow \frac{\delta\Phi}{\delta f}=1.$

Для функционала $\Phi[f]=\int\limits_1^2 K(x)f(x)\,dx$ вариационная производная вычисляется как:

$\delta\Phi=\delta\int\limits_1^2 K(x)f(x)\,dx=\int\limits_1^2 \delta(K(x)f(x))\,dx=\int\limits_1^2 K(x)\delta f(x)\,dx\Rightarrow\frac{\delta\Phi}{\delta f}=K(x).$

Для функционала $\Phi[f]=\int\limits_1^2 L(f(x))\,dx$

$\delta\Phi=\delta\int\limits_1^2 L(f(x))\,dx=\int\limits_1^2 \delta L(f(x))\,dx=\int\limits_1^2\frac{\partial L}{\partial f}\delta f(x)\,dx\Rightarrow\frac{\delta\Phi}{\delta f}=\frac{\partial L}{\partial f}.$

Если выразить бесконечно малую разность функции

δ L (f)

через её производную и разность аргумента

δ f

, получается:

$\delta L=\frac{\partial L}{\partial f}\delta f.$

Легко видеть, что это определение обобщается на любую размерность интеграла. Для $n$ -мерного случая верна прямо обобщающая одномерный случай формула:

$\delta\Phi=\int\limits_\Omega\left(\frac{\delta\Phi}{\delta f}\right)\delta f(x)\,d^nx.$

Так же легко обобщается понятие вариационной производной на случай функционалов от нескольких аргументов^[1]:

$\delta\Phi[f,\;g,\;\ldots]=\int\limits_\Omega\left(\frac{\delta\Phi}{\delta f}\delta f(x)+\frac{\delta\Phi}{\delta g}\delta g(x)+\ldots\right)\,d\Omega.$

Примеры

(В здесь разность интегралов сводится в один интеграл.)

Для функционала $\Phi[f]=\int\limits_1^2\int\limits_3^4 L(f(x,\;y))\,dx\,dy$ многомерный случай вариационной производной вычисляется как:

$\delta\Phi=\delta\int\limits_1^2\int\limits_3^4 L(f(x,\;y))\,dx\,dy=\int\limits_1^2\int\limits_3^4\delta L(f(x,\;y))\,dx\,dy=\int\limits_1^2\int\limits_3^4\frac{\partial L}{\partial f}\delta f(x,\;y)\,dx\,dy\Rightarrow\frac{\delta\Phi}{\delta f}=\frac{\partial L}{\partial f}.$

Для функционала $\Phi[f,\;g]=\int\limits_1^2 L(f(x),\;g(x))dx$ имеем

$\delta\Phi=\delta\int\limits_1^2 L(f(x),\;g(x))\,dx=\int\limits_1^2\delta L(f(x),\;g(x))\,dx=\int\limits_1^2\left(\frac{\partial L}{\partial f}\delta f(x)+\frac{\partial L}{\partial g}\delta g(x)\right)\,dx\Rightarrow\frac{\delta\Phi}{\delta f}=\frac{\partial L}{\partial f},\;\frac{\delta\Phi}{\delta f}=\frac{\partial L}{\partial g}.$

Выражая бесконечно малую разность функции нескольких аргументов как полный дифференциал, получим:

$\delta L=\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial g}\delta g.$

Вариации и вариационные производные второго и высших порядков

Как это описано выше для первого порядка, можно ввести понятие второй вариации и второй вариационной производной функционала, а также $n$ -ой вариации и $n$ -ой вариационной производной:

$\delta^2\Phi,\;\frac{\delta^2\Phi[f]}{\delta f^2},\;\delta^n\Phi,\;\frac{\delta^n\Phi[f]}{\delta f^n}.$

Для функционалов, зависящих от нескольких функций, можно также ввести понятие смешанных вариационных производных разного порядка, например:

$\frac{\delta^3\Phi[f,\;g]}{\delta f^2\delta g}.$

Здесь мы не будем останавливаться на этом подробно, всё делается полностью аналогично введению соответствующих дифференциалов и производных для функции конечномерного аргумента.

Функционал вблизи конкретной точки в пространстве функций раскладывается в ряд Тейлора, если, конечно, вариационные производные всех порядков существуют. Как и в конечномерных случаях, сумма конечного числа членов этого ряда даёт значение функционала с определённой точностью (соответствующего порядка малости) лишь при небольших отклонениях его аргумента (при бесконечно малых). Кроме того, как и в случае функций конечномерного аргумента, ряд Тейлора (сумма всех членов) может не сходиться к функционалу, в него разложенному, при любых ненулевых конечных смещениях, хотя такие случаи достаточно редки в приложениях.

Применение вариационного исчисления

Хотя задачи, к которым применимо вариационное исчисление, заметно шире, в приложениях они главным образом сводятся к двум основным задачам:

нахождение точек в пространстве функций, на котором определён функционал — точек стационарного функционала, стационарных функций, линий, траекторий, поверхностей и т. п., то есть нахождение для заданного $Φ[f]$ таких $f$ , для которых $δΦ = 0$ при любом (бесконечно малом) $δ f$ , или, иначе, где $\frac{\delta\Phi}{\delta f}=0$ ,
нахождение локальных экстремумов функционала, то есть в первую очередь определение тех $f$ , на которых $Φ[f]$ принимает локально экстремальные значения — нахождение экстремалей (иногда также определение знака экстремума).

Очевидно, обе задачи тесно связаны, и решение второй сводится (при должной гладкости функционала) к решению первой, а затем проверке, действительно ли достигается локальный экстремум (что делается независимо вручную, или — более систематически — исследованием вариационных производных второго и, если все они одного знака и хотя бы одна из них равна нулю, то производных более высокого порядка). В описанном процессе выясняется и тип экстремума. Нередко (например, когда функция стационарного функционала единственная, а все изменения функционала при любом большом возмущении имеют один и тот же знак) решение вопроса, экстремум ли это и какого он типа, заранее очевидно.

При этом очень часто задача (1) оказывается не менее или даже более важной, чем задача (2), даже когда классификация стационарной точки неопределённа (то есть она может оказаться минимумом, максимумом или седловой точкой, а также слабым экстремумом, точкой, вблизи которой функционал точно постоянен или отличается от постоянного в более высоком порядке, чем второй). Например, в механике (и вообще в физике) кривая или поверхность стационарной потенциальной энергии означает равновесие, а вопрос, является ли она экстремалью, связан лишь с вопросом об устойчивости этого равновесия (который далеко не всегда важен). Траектории стационарного действия отвечают возможному движению, независимо от того, минимально действие на такой траектории, максимально, или седловидно. То же можно сказать о геометрической оптике, где любая линия стационарного вермени (а не только минимального, как в простой формулировке принципа наименьшего времени Ферма) соответствует возможному движению светового луча неоднородной оптической среде. Есть системы, где вообще нет экстремалей, но стационарные точки существуют.

Способы нахождения условных экстремумов и условных стационарных точек (см. ниже) делают вариационное исчисление ещё более мощным орудием решения обеих задач.

Техника варьирования

Основным техническим вопросом при нахождении вариационной производной интегрального функционала $Φ[f]$ , в подынтегральное выражение которого входит не только значение функции $f$ в точке $x$ , но и значения ее производных, то есть не только $f (x)$ , но и $d f / d x$ , $d 2 f / d x 2$ и так далее (в принципе могут входить производные любого порядка, хотя в практических задачах порядки, выше второго, встречаются гораздо реже). Производные входят туда практически всегда: например, такой функционал, как длина кривой, содержит производные первого порядка, а потенциальная энергия изогнутого упругого стержня — производные по меньшей мере второго порядка.

Неудобство^[2], заключающееся в том, что при этом в выражении $δΦ[f]$ появляются под интегралом не только члены с $δ f$ , но и с $δ(d f / d f)$ , устраняется интегрированием по частям.

Рассмотрим это сначала на простом частном примере, а затем на общем.

Пример: Пусть требуется найти вариационную производную функционала $\Phi[f]=\int\limits_1^2\left((f'(x))^2+(f(x))^3\right)\,dx$ , где штрихом обозначена производная по $x$ , и $f (x)$ , для которых значение $Φ$ экстремально.

Нетрудно выписать

$\delta\Phi=\delta\int\limits_1^2\left((f'(x))^2+(f(x))^3\right)\,dx=\int\limits_1^2\left(\delta\left((f'(x))^2\right)+\delta\left((f(x))^3\right)\right)\,dx=$

$=\int\limits_1^2\left(2f'(x)\delta(f'(x))+3(f(x))^2\delta f(x)\right)\,dx.$

Очевидно, операцию взятия производной по $x$ свободно можно поменять местами с операцией $δ$ . Тогда

$\delta\Phi=\int\limits_1^2\left(2f'(x)(\delta f(x))'+3(f(x))^2\delta f(x)\right)\,dx.$

Теперь, чтобы $δ f (x)$ не стояло под знаком производной, мешающего вынести за скобки $δ f (x)$ из обоих членов (оставшееся в скобках суть вариационная производная), надо в первом слагаемом воспользоваться интегрированием по частям:

$\delta\Phi=\int\limits_1^2 2f'(x)(\delta f(x))'\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx=$

$=2f'(x)\delta f(x)\bigg|_1^2-\int\limits_1^2(2f'(x))'\delta f(x)\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx.$

Теперь можно опять превратить сумму интегралов в один и вынести за скобки $δ f$ :

$\delta\Phi=2f'(x)\delta f(x)\bigg|_1^2-\int\limits_1^2(2f'(x))'\delta f(x)\,dx+\int\limits_1^2 3(f(x))^2\delta f(x)\,dx=$

$=2f'(x)\delta f(x)\bigg|_1^2+\int\limits_1^2\left(-(2f'(x))'\delta f(x)+3(f(x))^2\delta f(x)\right)\,dx=$

$=2f'(x)\delta f(x)\bigg|_1^2+\int\limits_1^2\left(-(2f'(x))'+3(f(x))^2\right)\delta f(x)\,dx,$

оставив граничный член $2f'(x)\delta f(x)\bigg|_1^2=2f'(2)\delta f(2)-2f'(1)\delta f(1)$ , стоящим отдельно.

Граничный член можно приравнять нулю^[3], решив тем самым задачу нахождения вариационной производной (действительно, она по определению есть то, что стоит под интегралом в больших скобках, соответствовать определению мешает только граничный член). Объяснение факта равенства нулю граничного члена не слишком строго (см. примечание ^[3]), но ограничимся им, чтобы сосредоточить внимание на главном.

Для начала зафиксируем $f$ в граничных точках, тогда граничный член исчезнет, так как $δ f$ должно будет при такой фиксации обращаться в ноль при $x = 1$ и $x = 2$ . Для многих задач такая фиксация граничных условий имеет место изначально. При поиске экстремума и вариационной производной на классе функций с такими граничными условиями граничный член можно просто отбросить. Но если граничные условия не наложены самой задачей, их можно наложить искусственно, решить задачу для фиксированных условий, а затем среди множества решений для разных граничных условий можно выбрать оптимальное (это обычно не составляет труда). Короче говоря, решение задачи с обнулением граничного члена содержит в себе среди прочих и решение первоначальной задачи, нужно лишь сузить класс уже найденных решений, меняя $f (1)$ и $f (2)$ и подобрав среди них лучшее. (Более аккуратный и общий подход — см. ниже).

Таким образом, здесь под вариационной производной будем понимать вариационную производную по классу функций с фиксированными концами, которая (при поиске экстремали и в подобных задачах) будучи приравненной нулю, определяет поведение функции внутри отрезка $[1;\;2]$ . В этом смысле, для нашего примера имеем:

$\frac{\delta\Phi}{\delta f}=(-2f'(x))'+3(f(x))^2,$

а необходимое условие экстремальности состоит в равенстве её нулю, то есть имеем уравнение для $f$ :

$-2f''(x)+3(f(x))^2=0.\$

Решение этого дифференциального уравнения даст явный вид $f (x)$ , но задача нахождения решений дифференциального уравнения лежит уже за рамками вариационного исчисления. Задача последнего ограничена получением такого уравнения и, возможно, дополнительных условий, ограничивающих класс допустимых решений.

Использование обобщённых функций

В этом разделе рассмотривается такой частный, но практически важный, случай применения обобщённых функций при решении вариационных задач, как использование дельта-функции Дирака.

Использование $δ$ -функции (не следует путать ее обозначение $δ(x)$ с символом вариации!), как и использование обобщённых функций вообще, позволяет значительно расширить класс функционалов, которые могут быть записаны в форме интегральных функционалов, и к которым, следовательно, применимы основные приёмы вариационного исчисления (описанные выше). При этом в число функционалов, записываемых в такой форме, попадают такие практически важные функционалы, как краевые функционалы, что сильно облегчает работу с ними и делает её систематичной.

Для облегчения восприятия данного раздела, будем выделять дельта-функцию жирным шрифтом: $\boldsymbol\delta$ — чтобы отличать от символа вариации.

Рассмотрим простой пример. Пусть надо найти функцию $f (x)$ , минимизирующую функционал $W[f]=\frac{1}{2}\int\limits_0^1(f'(x))^2\,dx$ притом, что на неё наложены условия $f(0)=10,\;f(1)=20$ .

Для того, чтобы было удобно решать эту задачу, наложенные условия полезно записать в виде $\Gamma_0[f]=10,\;\Gamma_1[f]=20$ (в этом случае, $\Gamma_0[f]=f(0),\;\Gamma_1[f]=f(1)$ суть функционалы). Не ограничиваясь этим, используя основное свойство дельта-функции, запишем $Γ 0$ и $Γ 1$ в интегральной форме:

$\Gamma_0[f]=\int\limits_{-\infty}^{+\infty}\boldsymbol\delta(x-0)f(x)\,dx,$

$\Gamma_1[f]=\int\limits_{-\infty}^{+\infty}\boldsymbol\delta(x-1)f(x)\,dx.$

Теперь можно (расширив область интегрирования в определении $W$ , хотя бы на бесконечно малую величину, за пределы отрезка $[0;1]$ ) свободно складывать и вычитать^[4] функционалы $W,\;\Gamma_0,\;\Gamma_1$ , что позволяет формально просто свести решение исходной задачи к задаче об условном экстремуме функционала (см. ниже), сводящейся к отысканию экстремума нового функционала $V = W - λ 0 Γ 0 - λ 1 Γ 1$ с постоянными множиталями $\lambda_0,\;\lambda_1$ , конкретные значения которых после решения задачи по отысканию минимума $V$ нужно подобрать, решив соответствующие алгебраические уравнения. Таким образом, граничные условия будут удовлетворены. А главное, функционал $V$ при этом будет иметь вполне прозрачную интегральную форму, удобную для варьирования.

Сходный приём удобен при наложении на искомую фунцию не граничных условий, а условий удовлетворения некоторому уравнению в каждой точке $x$ .

Условные экстремумы

Для краткости будем говорить в этом разделе об условных экстремумах, однако всё здесь написанное ра́вно приложимо к нахождению стационарных точек вообще.

Условным экстремумом называется экстремум не на всей области определения функции (функционала), а на определённом её подмножестве, выделяемом специально наложенным условием (или условиями). Обычно, речь идёт о выделении этим условием (условиями) подмножества области определения с меньшей размерностью, что для конечномерных областей имеет определённый наглядный смысл, но для бесконечномерных (каковы обычно области определения функционалов) налагаемые условия приходится рассматривать лишь абстрактно (что теоретически не мешает иметь в виду полезную аналогию с конечномерным случаем).

Пусть надо найти экстремум функционала $Φ[f]$ при некотором наложенном условии.

Замечания и примеры

Как обычно, тривиальный случай, когда наложенное условие сводится к явному выражению чего-то через что-то (например, если известно, что $f=\mathrm{const}\cdot\sin(x)+\mathrm{const}'\cdot\cos(x)$ ), нет смысла специально рассматривать, так как это приводит просто к некоторому переписыванию функционала в новом виде (или даже к сведению функционала к функции конечного количества переменных).

Рассмотрения заслуживает случай, когда налагаемое в виде равенства нулю (в общем случае, константе) неких других функционалов (одного или нескольких), или наложение на искомую функцию уравнения, которому она должна удовлетворять.

Типичный случай первой задачи с одним наложенным условием — изопериметрическая задача (например, задача Дидонны). Примером второго типа условия может быть наложение в некоторых физических задачах требования подчинению уравнению непрерывности (для стационарных задач — его стационарного варианта $\mathrm{div}\vec v=0$ ).

Основные виды задачи на условный экстремум, которые имеет смысл рассмотреть, таковы:

Надо найти экстремум функционала $U[f]\$ при условии равенства нулю другого функционала $V[f]=0\$ ; (то, что в правой части нуль, не нарушает общности).
Надо найти экстремум функционала $U[f]\$ при условии $V_1[f]=0,\;V_2[f]=0,\;\ldots,\;V_N[f]=0$ .
Надо найти экстремум функционала $U[f]\$ при условии выполнения для $f\$ уравнения $v(f,\;f',\;f'',\;\ldots,\;f^{(n)})=0$ , где $v\$ — некоторая функция $f\$ и/или производных $f\$ , обозначенных штрихами.

(Третий тип условия выписан здесь не в самом общем виде, но для наших целей этого достаточно.)

К первым двум случаям практически прямо (на принятом сейчас нами уровне строгости нет смысла проводить тут границу между случаем функций конечномерного аргумента, и функционалами) применим метод неопределенных множителей Лагранжа. А именно, для нахождения условного экстремума $U[f]\$ при наложении соответстсующих условий, нужно решить вариационную задачу для функционала $\hat U[f] = U[f] - \lambda V[f]$ в первом и $\hat U[f] = U[f] - \lambda_1 V_1[f] - \lambda_2 V_2[f]- \dots - \lambda_N V_N[f]$ во втором случае, а затем подобрать (решив уравнение $d \hat U/ d \lambda = 0$ в первом случае и N уравнений с частными производными по каждому из $λ i$ во втором) такие $λ$ , которые реализуют минимум в найденном семействе функций f, для котого эти $λ$ являются параметрами. То есть, что касается вариационного исчисления, то ключевым моментом является нахождение и приравнивание нулю вариации (или вариационной производной) для некоего нового функционала $\hat U[f]$ , для этих двух случаев:

$\delta \hat U = \delta (U - \lambda V) = 0,$
$\delta \hat U = \delta (U - \lambda_1 V_1- \lambda_2 V_2 - \dots - \lambda_N V_N) = \delta (U - \sum_i\lambda_i V_i) = 0,$

Третий же случай рассмотрим здесь для интегрального функционала $U[f] = \int\limits_\Omega \dots d\Omega$ . Тогда нахождение условного экстремума сводится сначала к варьированию функционала

$\hat U[f] = U[f] - \int\limits_\Omega \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)})d\Omega$

$\int\limits_\Omega \bigg( \dots - \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)}) \bigg)d\Omega$ ,

где $x$ - переменная, принадлежащая области интегрирования $Ω$ (одномерной или n-мерной), а $λ(x)$ - некая неопределенная функция x, которая войдет в уравнение, полученное после вычисления вариационной производной и приравнивания ее нулю.

Обоснованием такого решения для случая 3 может служить представление для каждой точки $x 0$ из $Ω$ выполнения равенства $v(f(x_0), f'(x_0), \dots, f^{(n)}(x_0)) = 0$ в $x 0$ как приравнивание нулю функционала $V_{x_0} = \int\limits_\Omega \delta(x-x_0) \lambda(x_0) v(f,\;f',\;f'',\;\ldots,\;f^{(n)})d\Omega$ с использованием дельта-функции Дирака. Далее можно считать на рассматриваемом здесь неформальном уровне очевидным, что задача стала аналогичной варианту 2, и, после суммирования по всем $x 0$ , ее решение сводится к описанному выше.

Таким образом, ключевой момент с точки зрения вариационного исчисления в нахождении условного экстремума третьего типа сводится к

3. $\delta \hat U = \delta \int\limits_\Omega \bigg( \dots - \lambda(x) v(f,\;f',\;f'',\;\ldots,\;f^{(n)}) \bigg)d\Omega = 0.$

Под производными при многомерном x можно иметь в виду, например, частные производные разного порядка, в том числе смешанные.

Уравнение Эйлера — Лагранжа

Основная статья: Уравнения Эйлера — Лагранжа

Одним из основных классических результатов вариационного исчисления, имеющих огромное практическое значение, являются уравнения Эйлера — Лагранжа — дифференциальные уравнения, которым должна удовлетворять функция, являющаяся стационарной для довольно общего в своем классе и очень важного вида интегрального функционала (а значит и функция, на которой такой функционал достигает локального экстремума, тоже должна необходимо удовлетворять этим уравнениям).

Здесь приводится вывод уравнений Эйлера — Лагранжа с использованием производной функционала по направлению.

Вывод с использованием производной по направлению. Частный пример

Для гладких функций вещественной переменной или конечномерного векторного аргумента максимум и минимум заданной функции может быть найден путём нахождения точек, в которых производная обращается в нуль (по крайней мере, это необходимое условие экстремума). Аналогично решение гладких задач вариационного исчисления может быть получено путём решения соответствущего уравнения Эйлера — Лагранжа.

Чтобы проиллюстрировать этот процесс, рассмотрим сначала конкретную задачу нахождения кратчайшей кривой на плоскости, соединяющей две точки $(x_1,\;y_1)$ и $(x_2,\;y_2)$ . Длина кривой определяется выражением

$A[f]=\int\limits_{x_1}^{x_2}\sqrt{1+[f'(x)]^2}\,dx,$

где

$f'(x)=\frac{df}{dx},$

и где $y = f (x)$ , $f (x 1) = y 1$ и $f (x 2) = y 2$ . Функция $f$ должна иметь хотя бы одну производную. Если $f 0$ — локальный минимум и $f 1$ — подходящая функция, обращающаяся в нуль в граничных точках $x 1$ и $x 2$ и имеющая хотя бы первую производную, тогда мы получим

$A[f_0]\leqslant A[f_0+\varepsilon f_1]$

для любого $\varepsilon$ , близкого к 0. Следовательно, производная $A[f_0+\varepsilon f_1]$ по $\varepsilon$ (первая вариация $A$ ) должна обращаться в нуль при $\varepsilon=0$ . Таким образом,

$\int\limits_{x_1}^{x_2}\frac{f_0'(x)f_1'(x)}{\sqrt{1+[f_0'(x)]^2}}\,dx=0$

при любом выборе функции $f 1$ . Если предположить, что $f 0$ имеет вторую непрерывную производную, тогда можно воспользоваться формулой интегрирования по частям:

$\int\limits_a^b u(x)v'(x)\,dx=u(x)v(x)\bigg|_a^b-\int\limits_a^b u'(x)v(x)\,dx.$

После замены

$u(x)=\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}},\quad v'(x)=f_1'(x),$

получается

$u(x)v(x)\bigg|_{x_1}^{x_2}-\int\limits_{x_1}^{x_2} f_1(x)\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]\,dx=0,$

но первое слагаемое обращается в нуль, поскольку $v (x) = f 1 (x)$ было выбрано таким образом, чтобы обращаться в нуль в точках $x 1$ и $x 2$ . Следовательно,

$\int\limits_{x_1}^{x_2} f_1(x)\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]\,dx=0$

для любой дважды дифференцируемой функции $f 1$ , которая обращается в нуль на концах интервала. Это особый случай основной леммы вариационного исчисления:

$I=\int\limits_{x_1}^{x_2} f_1(x)H(x)\,dx=0$

для любой дифференцируемой функции $f 1 (x)$ , которая обращается в нуль на концах интервала. Поскольку $f 1 (x)$ есть произвольная функция в интервале интегрирования, можно сделать вывод, что $H (x) = 0$ . Тогда,

$\frac{d}{dx}\left[\frac{f_0'(x)}{\sqrt{1+[f_0'(x)]^2}}\right]=0.$

Из этого уравнения следует, что

$\frac{d^2f_0}{dx^2}=0.$

Таким образом, экстремумом в нашей задаче являются отрезки прямых линий.

Вывод с использованием производной по направлению. Более общий случай

Подобные же вычисления можно провести и в общем случае^[5], когда

$A[f]=\int\limits_{x_1}^{x_2} L(x,\;f,\;f')\,dx$

и $f$ должна иметь две непрерывные производные. Повторяя рассуждения, находим экстремаль $f 0$ , принимаем $f=f_0+\varepsilon f_1$ , находим производную по $\varepsilon$ , затем подставляем $\varepsilon=0$ :

$\left.\frac{dA}{d\varepsilon}\right|_{\varepsilon=0}=\int\limits_{x_1}^{x_2} \left.\frac{dL}{d\varepsilon}\right|_{\varepsilon=0}\,dx=$

$=\int\limits_{x_1}^{x_2}\left(\frac{\partial L}{\partial f}f_1+\frac{\partial L}{\partial f'}f'_1\right)\,dx=\int\limits_{x_1}^{x_2}\left(\frac{\partial L}{\partial f}f_1-f_1\frac{d}{dx}\frac{\partial L}{\partial f'}\right)\,dx+\left.\frac{\partial L}{\partial f'}f_1\right|_{x_1}^{x_2}=$

$=\int\limits_{x_1}^{x_2}f_1\left(\frac{\partial L}{\partial f}-\frac{d}{dx}\frac{\partial L}{\partial f'}\right)\,dx=0.$

Наконец, в силу основной леммы вариационного исчисления можно заключить, что функция $L$ должна удовлетворять уравнению Эйлера — Лагранжа

$-\frac{d}{dx}\frac{\partial L}{\partial f'}+\frac{\partial L}{\partial f}=0.$

В общем случае, это уравнение является обыкновенным дифференциальным уравнением второго порядка, решив которое, можно найти экстремаль $f$ .

Уравнение Эйлера — Лагранжа является необходимым, но не достаточным условием наличия экстремума. Дополнительные условия формулируются отдельно.

Примечания

↑ Формально можно свести функционал нескольких аргументов $\Phi_n[f_1,\;f_2,\;\ldots,\;f_n]$ , использовав функцию с множеством значений, в более многомерном пространстве $f:f(x)=(f_1(x),\;f_2(x),\;\ldots,\;f_n(x))$ , к функционалу, зависящему от одной этой новой функции $Φ 1 [f]$ , но чисто технически нередко бывает удобнее использовать первоначальный вариант без изменений, так как при конкретных вычислениях всё сводится в конечном счёте к покомпонентному расчёту, когда все $f_1(x),\;f_2(x),\;\ldots,\;f_n(x)$ — вещественнозначные (в крайнем случае, комплекснозначные) функции.
↑ Неудобство тут прежде всего в том, что производные мешают вынести все $δ f$ за скобки, приведя $δΦ$ к виду $\int(\ldots)\delta f(x)\,dx$ , что и означает нахождение вариационной производной (которая есть всё, что стоит в скобках и обозначено многоточием). Но даже если функционал таков, что производная легко выносится за скобки, то есть вариацию можно представить в виде $\int(\ldots)\delta\frac{df(x)}{dx}\,dx$ , то от дифференцирования $δ f$ всё равно необходимо избавиться. Это необходимо, исходя из тех соображений, что по определению (и по смыслу) при вариационной производной под интегралом должно стоять только $δ f$ , и что $d f / d x$ оказывается уже не «любой» функцией $x$ . В противном случае, при поиске экстремума, может найтись неучтённое направление, по которому $\delta\Phi\ne 0$ . То, что $d f / d x$ — уже не любая функция, легко увидеть при наложении граничных условий. Как описано в статье, это затруднение легко разрешаемо.
↑ ¹ ² Используя дельта-функцию Дирака, можно получить более строий результат сразу с учётом граничного члена, но здесь, для упрощения изложения, обойдёмся таким подходом.
↑ Конечно, операция сложения и вычитания функционалов в принципе определена независимо от формы их записи, однако использование одинаковой формы сводит ее к совершенно автоматической, прозрачной и технически удобной, так как всё теперь сводится просто к сложению интегралов по одной и той же области, а значит — к сложению подынтегральных выражений.
↑ Здесь явно разобран случай, где функция Лагранжа $L$ имеет аргументами всего одну функцию $f$ и одну её первую производную (этот случай наиболее важен практически), причём интегрирование ведётся по одной вещественной переменной. Однако теорема и доказательство достаточно легко и прямо обобщаются на любое конечное число аргументов, любой конечный порядок по производным, и на формулировку с интегрированием по конечномерной области.

Литература

Краснов М. Л., Макаренко Г. И., Кисилев А. И. Вариационное исчисление, задачи и упражнения. — М.: Наука, 1973

Эльсгольц Л. Э. Дифференциальные уравнения и вариационное исчисление. — М.: Наука, 1969

Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979

Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия: Методы и приложения. — М.: Наука, 1979

Фейнман Р., Лейтон Р., Сэндс М. Фейнмановские лекции по физике. Том 6: Электродинамика. Перевод с английского (издание 3). — Эдиториал УРСС. — ISBN 5-354-00704-6 — глава 19: Принцип наименьшего действия. (Очень простое, неформальное и наглядное введение в технику варьирования на примере принципа наименьшего действия; рекомендуется для старших школьников и, быть может, студентов младших курсов).

См. также

Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

Словари и энциклопедии на Академике

Вариационное исчесление

Содержание

История

Неформальное обсуждение

Вариация

Производная по направлению

Вариационная производная

Вариации и вариационные производные второго и высших порядков

Применение вариационного исчисления

Техника варьирования

Использование обобщённых функций

Условные экстремумы

Уравнение Эйлера — Лагранжа

Вывод с использованием производной по направлению. Частный пример

Вывод с использованием производной по направлению. Более общий случай

Примечания

Литература

См. также

Полезное

Поделиться ссылкой на выделенное

Словари и энциклопедии на Академике

Википедия

Вариационное исчесление

Содержание

История

Неформальное обсуждение

Вариация

Производная по направлению

Вариационная производная

Вариации и вариационные производные второго и высших порядков

Применение вариационного исчисления

Техника варьирования

Использование обобщённых функций

Условные экстремумы

Уравнение Эйлера — Лагранжа

Вывод с использованием производной по направлению. Частный пример

Вывод с использованием производной по направлению. Более общий случай

Примечания

Литература

См. также

Полезное

Поделиться ссылкой на выделенное

Прямая ссылка: