Главная > Математика > Математический анализ. Часть I. (Зорич В.А.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3. Условный экстремум

а. Постановка вопроса.

Одним из наиболее ярких и популярных достижений дифференциального исчисления являются предлагаемые им рецепты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось, к внутренним экстремумам.

Иными словами, эти результаты применимы только к исследованию поведения функции в окрестности точки тогда, когда аргумент х может принимать любое значение из некоторой окрестности в точки

Часто возникает более сложная и с практической точки зрения даже более интересная ситуация, когда ищется экстремум функции при некоторых условиях, ограничивающих область изменения аргумента. Типичным примером может служить изопериметрическая задача, когда ищется тело, имеющее максимальный объем при условии, что ограничивающая его поверхность имеет заданную площадь. Чтобы получить доступную нам математическую запись такой задачи, упростим постановку и будем считать, что задача состоит в том, чтобы среди прямоугольников, имеющих заданный периметр найти тот, который имеет наибольшую площадь . Обозначив через х и у длины сторон прямоугольника, запишем, что

Итак, надо найти экстремум функции при условии, что переменные связаны соотношением Таким образом, экстремум функции ищется только на множестве тех точек плоскости которые удовлетворяют указанному соотношению. Эта конкретная задача, конечно, решается без труда: достаточно, записав, что подставить это выражение в формулу для и найти обычными методами максимум функции Она нам была нужна лишь для пояснения самой постановки вопроса.

В общем случае задача на условный экстремум обычно состоит в том, чтобы найти экстремум вещественнозначной функции

от переменных при условии, что эти переменные удовлетворяют системе уравнений

Поскольку мы собираемся получать дифференциальные условия экстремума, мы будем предполагать, что все рассматриваемые функции дифференцируемы и даже непрерывно дифференцируемы. Если ранг системы функций

равен то условия (25) задают в некоторую -мерную гладкую поверхность и с геометрической точки зрения задача на условный экстремум состоит в отыскании экстремума функции на поверхности Более точно, рассматривается ограничение функции на поверхность и ищется экстремум функции

Смысл самого понятия точки локального экстремума при этом, конечно, остается прежним, т. е. точка считается точкой локального экстремума функции на или, короче, функции если найдется такая окрестность точки в множестве Если что для любой точки выполнено неравенство (тогда — точка локального минимума) или (тогда — точка локального максимума). Если при указанные неравенства являются строгими, то экстремум, как и прежде, будем называть строгим.

b. Необходимый признак условного экстремума

Теорема 1. Пусть функция, определенная на открытом множестве Если и принадлежащая классу Пусть — гладкая поверхность в

Для того чтобы точка некритическая для функции была точкой локального экстремума функции необходимо выполнение условия

где — пространство, касательное к поверхности в точке — пространство, касательное к поверхности уровня функции которому принадлежит

Заметим прежде всего, что требование, чтобы точка была некритической для функции в контексте обсуждаемой задачи отыскания условного экстремума не является существенным ограничением. Действительно, если уж точка является критической точкой функции или точкой экстремума этой функции, то ясно, что она будет подозрительной точкой или соответственно точкой экстремума и для функции Таким образом, новый элемент в рассматриваемой задаче состоит именно в том, что функция может иметь критические точки и экстремумы, отличные от критических точек и экстремумов функции

Возьмем произвольный вектор и такой гладкий путь на , который проходит через точку при и для которого вектор является вектором скорости при т. е.

Если точка экстремума функции то гладкая функция должна при иметь экстремум. По необходимому условию экстремума ее производная при должна обращаться в нуль, т. е. должно выполняться условие

где

Поскольку — некритическая точка функции условие (28) равносильно тому, что ибо именно соотношение (28) является уравнением касательного пространства

Таким образом, доказано, что Если

Если поверхность в окрестности точки задана системой уравнений (25), то пространство как нам известно, задается системой линейных уравнений

Пространство задается уравнением

и, поскольку всякое решение системы (29) является решением уравнения (30), последнее уравнение является следствием системы (29).

Из этих соображений вытекает, что соотношение Если в аналитической записи равносильно тому, что вектор является линейной комбинацией векторов т. е.

Учитывая эту форму записи необходимого признака экстремума функции (24), переменные которой связаны соотношениями (25), Лагранж предложил при отыскании условного экстремума использовать следующую вспомогательную функцию:

переменных

Эту функцию называют функцией Лагранжа, а метод ее использования — методом множителей Лагранжа.

Функция (32) удобна тем, что необходимые условия ее экстремума как функции переменных в точности совпадают с условиями (31) и (25).

Действительно,

Таким образом, при отыскании экстремума функции (24), переменные которой подчинены связям (25), можно написать с неопределенными множителями функцию Лагранжа (32) и искать уже ее критические точки. Если есть возможность из системы (33) найти не находя то с точки зрения исходной задачи именно это и следует делать.

Как видно из соотношения (31), множители определяются однозначно, если только векторы линейно независимы. Независимость этих векторов равносильна тому, что ранг системы (29) равен т. е. что все уравнения этой системы существенны (ни одно из них не является следствием остальных).

Это обычно выполнено, ибо считается, что все соотношения (25) независимы и ранг системы функций в любой точке равен т.

Функцию Лагранжа часто записывают в виде

который отличается от прежнего только несущественной заменой А на —

Пример 9. Найдем экстремумы симметрической квадратичной формы

на сфере

Запишем функцию Лагранжа данной задачи:

и, с учетом того, что необходимые условия экстремума функции

Домножая первое уравнение на и суммируя затем все первые соотношения, с учетом второго уравнения получим, что в точке экстремума должно быть выполнено равенство

Систему (36) без последнего уравнения можно переписать в виде

откуда следует, что А — собственное значение линейного преобразования А, задаваемого матрицей — собственный вектор этого преобразования, отвечающий этому собственному значению.

Поскольку непрерывная на компакте функция (34) обязана принимать в некоторой его точке максимальное значение, система (36), а значит и система (38), должна иметь решение. Таким образом, мы попутно установили, что любая вещественная симметрическая матрица (о имеет по крайней мере одно вещественное собственное значение. Это хорошо известный вам из линейной алгебры результат, являющийся основным в доказательстве существования базиса из собственных векторов симметрического оператора.

Чтобы указать геометрический смысл собственного значения А, заметим, что если то, переходя к координатам вместо (37) получим

а вместо (35) —

Но есть квадрат расстояния от точки квадрики (39) до начала координат. Таким образом, если, например, соотношение (39) задает

эллипсоид, то величина обратная к собственному значению А, является квадратом величины одной из его полуосей.

Это полезное наблюдение. Оно, в частности, показывает, что соотношения (36), необходимые для условного экстремума, еще не являются достаточными: ведь, например, в эллипсоид кроме наибольшей и наименьшей полуосей может иметь промежуточную по величине полуось, в любой окрестности конца которой есть как точки более близкие к началу координат, так и более далекие от него в сравнении с расстоянием от конца полуоси до начала координат. Последнее становится совсем очевидным, если рассмотреть эллипсы, получающиеся в сечении исходного эллипсоида двумя плоскостями, проходящими через промежуточную полуось и меньшую или большую полуоси эллипсоида соответственно. В одном из этих случаев промежуточная полуось будет большей из двух полуосей эллипса сечения, а в другом случае — меньшей полуосью.

К сказанному следует добавить, что если есть величина этой промежуточной полуоси, то, как видно из канонического уравнения, эллипсоида, величина А, очевидно, будет собственным значением преобразования А, поэтому система (36), выражающая необходимые условия экстремума функции действительно будет иметь решение, не дающее экстремума этой функции.

Полученный в теореме 1 результат (необходимый признак условного экстремума) проиллюстрирован на рис. 63 а, Ь.

Первый из этих рисунков поясняет, почему точка поверхности не может быть точкой экстремума функции если 5 не касается поверхности в точке При этом предполагается, что . Последнее условие гарантирует то, что в окрестности точки имеются точки как более высокого -уровня функции так и точки более низкого -уровня этой функции.

Рис. 63

Поскольку гладкая поверхность пересекает поверхность т. е. -уровень гладкой функции то 5 будет пересекать как более высокие, так и более низкие уровни функции в окрестности точки Но это и означает, что не может быть точкой экстремума функции

Второй рисунок показывает, почему при касании в точке эта точка может оказаться точкой экстремума. На рисунке — точка локального максимума функции

Эти же соображения позволяют нарисовать картинку, аналитическая запись которой может показать, что необходимый признак условного экстремума не является достаточным.

Действительно, в соответствии с рис. 64 положим, например,

Тогда очевидно, что на кривой заданной уравнением величина у не имеет экстремума в точке (0,0), хотя эта кривая касается линии уровня функции в этой точке. Заметим, что

Рис. 64

Очевидно, это по существу тот же пример, который нам в свое время служил для иллюстрации различия между необходимым и достаточным условиями классического внутреннего экстремума функции.

с. Достаточный признак условного экстремума.

Докажем теперь следующий достаточный признак наличия или отсутствия условного экстремума.

Теорема 2. Пусть функция, определенная на открытом множестве Если и принадлежащая классу — поверхность в заданная системой уравнений (25), где и ранг системы функций в любой точке области равен .

Пусть в функции Лагранжа

параметры выбраны в соответствии с необходимым признаком (31) условного экстремума функции в точке

Для того чтобы при этом точка была точкой экстремума функции достаточно, чтобы квадратичная форма

была знакоопределенной для векторов

Если форма (41) положительно определена на то — точка строгого локального минимума функции если форма (41) отрицательно определена на то — точка строгого локального максимума функции

Для того чтобы точка не была точкой экстремума функции достаточно, чтобы форма (41) принимала на значения разных знаков.

Отметим прежде всего, что для поэтому, показав, что точка является точкой экстремума функции мы одновременно покажем, что она является точкой экстремума функции

По условию необходимый признак (31) экстремума функции в точке выполнен, поэтому в этой точке Значит, тейлоровское разложение функции в окрестности точки имеет вид

при

Напомним теперь, что, мотивируя определение 2, мы отметили возможность локального (например, в окрестности точки параметрического задания гладкой -мерной поверхности (в нашем случае ).

Иными словами, существует гладкое отображение

(мы будем его, как и прежде, записывать в виде при котором окрестность точки биективно преобразуется в некоторую окрестность точки на поверхности причем

Заметим, что соотношение

выражающее дифференцируемость отображения в точке равносильно координатным равенствам

в которых индекс а пробегает целые значения от 1 до А; и по нему происходит суммирование.

Из этих числовых равенств следует, что

и, значит

Используя соотношения (43), (44), из равенства (42) получаем, что при

Отсюда при условии знакоопределенности формы

следует, что функция имеет при экстремум. Если же форма (45) принимает значения разных знаков, то при экстремума не имеет. Но, поскольку при отображении некоторая окрестность точки преобразуется в окрестность точки на поверхности можно заключить, что тогда и функция в точке либо будет иметь экстремум, причем того же характера, что и функция либо, как и не будет иметь экстремума.

Итак, остается проверить, что для векторов выражения (41) и (45) просто являются разными записями одного и того же объекта.

Действительно, полагая

мы получаем вектор , касательный к в точке и если то

откуда и следует совпадение величин (41), (45).

Отметим, что практическое использование теоремы 2 затруднено тем, что среди координат вектора только независимых, поскольку координаты вектора должны удовлетворять системе (29), определяющей пространство Таким образом, непосредственное применение к форме (41) критерия Сильвестра в нашем случае, вообще говоря, ничего не дает: форма (41) может не быть определенной на но оказаться определенной на Если же из соотношений (29) выразить координат вектора через остальные к координат и полученные линейные формы подставить в (41), то мы придем к квадратичной форме относительно к переменных, определенность которой уже можно исследовать с помощью критерия Сильвестра.

Поясним сказанное простейшими примерами.

Пример 10. Пусть в пространстве с координатами задана функция

Ищется экстремум этой функции на плоскости 5, заданной уравнением

Записав функцию Лагранжа

и необходимые условия экстремума

находим подозрительную точку

Далее находим форму (41):

Отметим, что в данном случае параметр А не вошел в эту квадратичную форму, поэтому мы его и не вычисляли.

Записываем теперь условие

Из этого равенства находим и подставляем в форму (46), после чего она приобретает вид

где на сей раз — независимые переменные.

Последняя форма, очевидно, может принимать значения разных знаков, поэтому в точке функция экстремума не имеет.

Пример 11. В условиях примеру 10 заменим на и функцию на

сохранив условие

которое теперь задает прямую в плоскости

В качестве подозрительной найдем точку

Вместо формы (46) получим форму

с прежним соотношением (47) между

Таким образом, на форма (48) теперь имеет вид

т. е. является отрицательно определенной. Отсюда заключаем, что точка является точкой локального максимума функции

Весьма поучительны во многих аспектах следующие простые примеры, на которых можно отчетливо рассмотреть механизм работы как необходимых, так и достаточных условий экстремума, в том числе роль параметра и неформальную роль самой функции Лагранжа.

Пример 12. На плоскости с декартовыми координатами дана функция

Найдем экстремумы этой функции на эллипсе, заданном каноническим соотношением

где

Из геометрических соображений очевидно, что Получим это, опираясь на рекомендации теорем 1 и 2.

Записав функцию Лагранжа

и решая уравнение , т. е. систему находим ее

решения:

Теперь в соответствии с теоремой 2 выпишем и исследуем квадратичную форму - — второй член тейлоровского разложения функции Лагранжа в окрестности соответствующих точек:

В точках эллипса касательный вектор имеет вид квадратичная форма при принимает вид

Учитывая условие заключаем, что эта форма положительно определена и, значит, в точках имеется строгий локальный (а здесь, очевидно, и глобальный) минимум функции Аналогично находим форму

отвечающую точкам и получаем

Замечание. Обратите здесь внимание на роль функции Лагранжа в сравнении с ролью функции В соответствующих точках на указанных касательных векторах дифференциал функции (как и дифференциал обращается в нуль, а квадратичная форма положительно определена, в какой бы из этих точек ее ни вычислять. Тем не менее функция в точках имеет строгий минимум, а в точках — строгий максимум.

Чтобы понять, в чем тут дело, просмотрите еще раз доказательство теоремы 2 и попробуйте, заменив в на получить соотношение (42). Заметьте, что при этом у вас появится дополнительный член, содержащий Он не исчезнет в связи с тем, что в отличие от дифференциал функции в соответствующих точках не есть тождественный нуль, хотя на касательных векторах (вида ) его значения действительно равны нулю.

Пример 13. Найдем экстремумы функции

на эллипсоиде 5, заданном соотношением

где

Записав функцию Лагранжа

в соответствии с необходимым признаком экстремума находим решения уравнения т. е. системы

Квадратичная форма

в каждом из этих случаев на соответствующей касательной плоскости имеет вид

Поскольку то на основании теоремы 2, дающей достаточный признак наличия или отсутствия условного экстремума, можно заключить, что в случаях (а) и мы нашли соответственно в точках отвечающих случаю функция экстремума не имеет. Это вполне согласуется с очевидными геометрическими соображениями, высказанными по этому поводу при обсуждении необходимого признака условного экстремума.

Некоторые дальнейшие, порой весьма полезные стороны встретившихся в этом параграфе понятий анализа и геометрии, в том числе физическая интерпретация самой задачи об условном экстремуме, а также его необходимого признака (31) как разложения сил в точке равновесия и интерпретация множителей Лагранжа как величин реакций идеальных связей, представлены в приведенных ниже задачах и упражнениях.

Задачи и упражнения

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление