Главная > Математика > Математический анализ. Часть I. (Зорич В.А.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5. Экстремумы функций многих переменных.

Одним из важнейших применений дифференциального исчисления является его использование для отыскания и исследования экстремумов функций.

Определение 1. Говорят, что функция , определенная на множестве Если имеет локальный максимум (локальный минимум) во внутренней точке множества Е, если существует окрестность Если точки такая, что (соответственно, при

Если при имеет место строгое неравенство (или, соответственно, то говорят, что функция имеет в точке строгий локальный максимум (строгий локальный минимум).

Определение 2. Локальные минимумы и локальные максимумы функции называют ее локальными экстремумами.

Теорема 5. Пусть функция определенная в окрестности точки имеет в точке частные производные по каждой из переменных

Тогда для того, чтобы функция имела в локальный экстремум, необходимо, чтобы в этой точке были выполнены равенства

Рассмотрим функцию одной переменной, определенную, в силу условий теоремы, в некоторой окрестности точки вещественной оси. В точке функция имеет локальный экстремум, и поскольку

Аналогично доказываются и остальные равенства системы (12).

Обратим внимание на то, что равенства (12) дают лишь необходимые, но не достаточные условия экстремума функции многих переменных. Примером, подтверждающим это, может стать любой пример, построенный по этому же поводу для функции одной переменной. Так, если раньше мы говорили о функции имеющей в нуле нулевую производную, но не имеющей там экстремума, то теперь можно рассмотреть функцию

все частные производные которой в точке равны нулю, но экстремума в этой точке функция, очевидно, не имеет.

Теорема 5 показывает, что если функция определена на открытом множестве Если то ее локальные экстремумы находятся либо среди точек, в которых не дифференцируема, либо в тех точках, в которых дифференциал или, что то же самое, касательное отображение обращается в нуль.

Нам известно, что если отображение определенное в окрестности точки дифференцируемо в то матрица касательного отображения имеет вид

Определение 3. Точка называется критической точкой отображения если ранг матрицы Якоби (13) отображения в этой точке меньше, чем т. е. меньше, чем максимально возможный.

В частности, при точка критическая, если выполнены условия (12), т. е. все частные производные функции обращаются в нуль.

Критические точки вещественнозначных функций называют также стационарными точками таких функций.

После того как в результате решения системы уравнений (12) найдены критические точки функции, их дальнейший анализ в отношении того, являются они точками экстремума или нет, часто удается провести, используя формулу Тейлора и доставляемые ею следующие достаточные условия наличия или отсутствия экстремума.

Теорема 6. Пусть — функция класса ), определенная в окрестности точки и пусть — критическая точка этой функции

Если в тейлоровском разложении

функции в точке квадратичная форма

a) знакоопределена, то в точке функция имеет локальный экстремум, который является строгим локальным минимумом, если квадратичная форма (15) положительно определена, и строгим локальным максимумом, если она отрицательно определена;

b) может принимать значения разных знаков, то в точке функция экстремума не имеет.

Пусть Представим соотношение (14) в виде

где есть величина, бесконечно малая при

Из (16) видно, что знак разности полностью определяется знаком величины, стоящей в квадратных скобках. Этой величиной мы теперь и займемся.

Вектор очевидно, имеет единичную норму. Квадратичная форма (15) непрерывна как функция в поэтому ее ограничение на единичную сферу также непрерывно на Но сфера 5 есть замкнутое ограниченное подмножество в т. е. компакт. Следовательно, форма (15) имеет на как точку минимума, так и точку максимума, в которых она принимает соответственно значения и М.

Если форма (15) положительно определена, то и потому найдется число такое, что при будет Тогда при квадратная скобка в правой части равенства (16) окажется положительной и, следовательно, при Таким образом, в этом случае точка оказывается точкой строгого локального минимума рассматриваемой функции.

Аналогично проверяется, что в случае отрицательной определенности формы (15) функция имеет в строгий локальный максимум.

Тем самым пункт а) теоремы 6 исчерпан.

Докажем утверждение

Пусть и ем те точки единичной сферы, в которых форма (15) принимает соответственно значения , и пусть

Полагая где — достаточно малое положительное число (настолько малое, что из (16) находим

где при . Начиная с некоторого момента (т. е. при всех достаточно малых значениях величина в правой части этого равенства будет иметь знак т. е. будет отрицательна. Следовательно, отрицательной будет и левая часть.

Аналогично, полагая получим

и, следовательно, при всех достаточно малых разность положительна.

Таким образом, если квадратичная форма (15) на единичной сфере или, что, очевидно, равносильно, в принимает значения разных знаков, то в любой окрестности точки найдутся как точки, в которых значение функции больше так и точки, в которых оно меньше Следовательно, в этом случае не является точкой локального экстремума рассматриваемой функции.

Сделаем теперь несколько замечаний в связи с доказанной теоремой.

Замечание 1. Теорема 6 ничего не говорит о случае, когда форма (15) полуопределена, т. е. неположительна или неотрицательна. Оказывается, в этом случае точка может быть точкой экстремума, а может и не быть таковой. Это видно, в частности, из следующего примера.

Пример 3. Найдем экстремумы определенной в функции

В соответствии с необходимыми условиями (12) напишем систему уравнений

из которой находим три критические точки: .

Поскольку

то квадратичная форма (15) в указанных трех критических точках имеет соответственно вид

т. е. во всех случаях она полуопределена (положительно или отрицательно). Теорема 6 тут не применима, но поскольку то очевидно, что в точках функция имеет строгий минимум — 1 (и даже нелокальный), а в точке (0,0) у нее нет экстремума, поскольку при при и достаточно малых

Замечание 2. После того как квадратичная форма (15) получена, исследование ее определенности может быть проведено с помощью известного из курса алгебры критерия Сильвестра. Напомним, что в силу критерия Сильвестра квадратичная форма с симметрической матрицей

положительно определена тогда и только тогда, когда положительны все главные миноры этой матрицы; форма отрицательно определена тогда и только тогда, когда и при переходе от любого главного минора матрицы к главному минору следующего порядка знак значения минора меняется.

Пример 4. Найдем экстремумы функции

определенной в плоскости всюду, кроме начала координат.

Решая систему

находим все критические точки функции

Поскольку функция нечетна относительно каждого из двух своих аргументов в отдельности, то точки очевидно, не являются точками экстремума нашей функции.

Видно также, что данная функция не меняет своего значения при одновременном изменении знака обеих переменных х и у. Таким образом, если мы исследуем только одну из оставшихся критических точек, например точку то мы сможем сделать заключение и о характере остальных.

Поскольку

то в точке квадратичная форма имеет матрицу

т. е. она положительно определена, и, следовательно, в этой точке функция имеет локальный минимум

В силу сделанных выше наблюдений относительно особенностей рассматриваемой функции можно сразу же заключить, что

— также локальный минимум, а

— локальные максимумы функции. Впрочем, это можно проверить и непосредственно, убедившись в определенности соответствующей квадратичной формы. Например, в точке матрица квадратичной формы (15) имеет вид

откуда видно, что форма отрицательно определена.

Замечание 3. Следует обратить внимание на то, что мы указали необходимые (теорема 5) и достаточные (теорема 6) условия экстремума функции лишь во внутренней точке области определения. Таким образом, при отыскании абсолютного максимума или минимума функции необходимо наряду с внутренними критическими точками функции исследовать также точки границы области определения, поскольку максимальное или минимальное значение функция может принять в одной из таких граничных точек.

Подробнее общие принципы исследования невнутренних экстремумов будут разбираться позже (см. раздел, посвященный условному экстремуму). Полезно иметь в виду, что при отыскании минимумов и максимумов часто наряду с формальной техникой, а иногда и вместо нее, можно использовать некоторые простые соображения, связанные с природой задачи. Например, если рассматриваемая в дифференцируемая функция по смыслу задачи должна иметь минимум и вместе с тем она не ограничена сверху, то, при условии, что функция имеет единственную критическую точку, можно без дальнейшего исследования утверждать, что в этой точке она и принимает свое минимальное значение.

Пример 5. Задача Гюйгенса. На основе законов сохранения энергии и импульса замкнутой механической системы несложным расчетом можно показать, что при соударении двух абсолютно упругих шаров, имеющих массы и начальные скорости их скорости после центрального удара (когда скорости направлены по линии центров) определяются соотношениями

В частности, если шар массы М, движущийся со скоростью V, ударяется о неподвижный шар массы то приобретаемая последним скорость может быть найдена по формуле

из которой видно, что если , то

Каким же образом телу малой массы можно передать значительную часть кинетической энергии большой массы? Для этого, например, между шарами

малой и большой масс можно вставить шары с промежуточными массами Вычислим (вслед за Гюйгенсом), как надо выбрать массы чтобы в результате последовательных центральных соударений тело приобрело наибольшую скорость.

В соответствии с формулой (17) получаем следующее выражение для искомой скорости как функции от переменных

Таким образом, задача Гюйгенса сводится к отысканию максимума функции

Система уравнений (12), представляющих необходимые условия внутреннего экстремума, в данном случае сводится к системе

из которой следует, что числа образуют геометрическую прогрессию со знаменателем равным .

Получаемое при таком наборе масс значение скорости (18) определяется равенством

которое при совпадает с равенством (17).

Из физических соображений ясно, что формула (19) указывает максимальное значение функции (18), однако это можно проверить и формально (не привлекая громоздких вторых производных; см. задачу 9 в конце параграфа).

Заметим, что из формулы (19) видно, что если то Таким образом, промежуточные массы действительно заметно увеличивают передаваемую малой массе часть кинетической энергии массы М.

<< Предыдущий параграф Следующий параграф >>
Оглавление