Содержание.

1. Введение………………………………………………3

2. Историческая справка………………………………..4

3. Экстремумы функций одной переменной.

3.1. Необходимое условие……………………………6

3.2.1. Достаточное условие. Первый признак………8

3.2.2. Достаточное условие. Второй признак……….10

3.3. Использование высших производных………….12

4. Экстремумы функций трех переменных.

4.1. Необходимое условие…………………………...13

4.2. Достаточное условие…………………………….14

5. Экстремумы функций многих переменных.

5.1. Необходимое условие……………………………19

5.2. Достаточное условие…………………………….21

5.3. Метод вычисления критериев Сильвестера……24

5.4. Замечание об экстремумах на множествах…….33

6. Условный экстремум.

6.1. Постановка вопроса……………………………..35

6.2. Понятие условного экстремума…………………36

6.3. Метод множителей Лагранжа для нахождения точек условного экстремума…………………………………..38

6.4. Стационарные точки функции Лагранжа………42

6.5. Достаточное условие…………………………….49

7. Заключение……………………………………………54

8. Библиография..………………………………………..55

Цель данного дипломномного проекта заключается в рассмотрении экстремумов функции одной и многих переменных и подробном описании методов их нахождения.

Задача состоит в формулировании необходимых и достаточных условий существования максимума и минимума функции, выборе метода нахожденя экстремумов и их полном математическом обосновании.

Гипотезой дипломного проекта является рассмотрение и описание экстремумов функции трёх переменных, формулировании необходимого и достаточного условия их существования, а также рассмотрение метода вычисления критериев Сильвестера.

В качестве объекта для исследования и описания использовались функции одной и многих переменных.

1. Введение.

Вмире не происходит ничего, в чем бы не был виден

Смысл какого-нибудь максимума или минимума.

Л.Эйлер.

В математике изучение задач на нахождение максимума и минимума началось очень давно. Но только лишь в эпоху формирования математического анализа были созданы первые методы решения и исследования задач на экстремум.

Потребности практической жизни, особенно в области экономики и техники, в последнее время выдвинули такие новые задачи, которые старыми методами решить не удавалось. Надо было идти дальше.

Потребности техники, в частности космической, выдвинули серию задач, которые также не поддавались средствам вариационного исчисления. Необходимость решать их привела к созданию новой теории, получившей название теории оптимального управления. Основной метод в теории оптимально управления был разработан в пятидесятые – шестидесятые годы советскими математиками – Л.С. Понтрягиным и его учениками. Это привело к тому, что теория экстремальных задач получила новый мощный толчок к дальнейшим исследованиям.

Цель дипломного проекта – рассмотрение и описание функций одной и многих переменных, а также в рассмотрении методов, используемых при этом.

Данный дипломный проект рассчитан на абитуриентов высших учебных заведений. На вопрос - можно ли ввести рассмотрение этой темы в старших классах школы – ответ будет дан в последней главе дипломного проекта, после рассмотрения задач и возможных методов их решения.

В дипломном проекте с большей логической стройностью и без повторений приведено изложение темы – функции одной и многих переменных, сообщены сведения из математического анализа, необходимые при изучении физики и ряда инженерных дисциплин.

2.Историческая справка.

В жизни постоянно приходится сталкиваться с необходимостью принять наилучшее возможное (иногда говорят - оптимальное) решение. Огромное число подобных проблем возникает в экономике и технике. При этом часто случается так, что полезно прибегнуть к математике.

В математике исследование задач на максимум и минимум началось очень давно – двадцать пять веков назад, Долгое время к задачам на отыскание экстремумов не было сколько – нибудь единых подходов. Но примерно триста лет назад – в эпоху формирования математического анализа – были созданы первые общие методы решения и исследования задач на экстремум.

Накопление методов дифференциального исчисления приняло наиболее явную форму у Ферма. В 1638 году он сообщил в письме Декарту, что решил задачу определения экстремальных значений функции f(x). Ферма составлял уравнение (f(x+h)-f(x))/h=0 и после преобразований в левой части полагал h=0, вопреки мнению позднейших исследователей, которые видели в этой идеи исчисления бесконечно малых. В действительности, Ферма нашел это условие и аналогичное (f(y)-f(x))/(y-x)=0 при y=x ещё алгебраическими путями.

Рассуждения при нахождении экстремума функции f(x) следующие. Пусть для некоторого x функция достигает максимума. Тогда f(x h)<f(x);f(x) Ph Qh² …<f(x) . Вычитаем из обеих частей и делим на h, откуда P Qh …<0.Так как h можно выбрать любой малости, член P будет по модулю больше суммы всех остальных членов. Неравенство поэтому возможно лишь при условии P=0, что и дает условие Ферма. В случае минимума рассуждения аналогичные. Ферма знал также, что знак Q определяет характер экстремума.

К сожалению, Ферма не стремился публиковать свои работы, кроме того, пользовался труднодоступными для усвоения алгебраическими средствами Виета с его громоздкой символикой. Видимо, поэтому он не сделал последнего, уже небольшого, шага на пути к созданию дифференциального исчисления.

Накопление фактов дифференциального исчисления происходило быстро. В «Дифференциальном исчислении» (1755) Эйлера это исчисление появляется уже в весьма полном виде.

Правила определения экстремумов функции одной переменной y=f(x) были даны Маклореном. Эйлер разработал этот вопрос для функции двух переменных. Лагранж показал (1789), как отличать вид условного экстремума для функции многих переменных.

В XVIII веке возникло исчисление вариаций. В трудах Эйлера и Лагранжа оно приобрело вид логически стройной математической теории. Главной задачей, решаемой средствами этого исчисления, являются отыскание экстремумов функционалов.

3.Экстремумы функций одной переменной.

3.1.Необходимое условие.

Пусть функция f(x), определенная и непрерывная в промежутке [a,b], не является в нем монотонной. Найдутся такие части [ , ] промежутка [a,b], в которых наибольшее и наименьшее значение достигается функцией во внутренней точке, т.е. между и .

Говорят, что функция f(x) имеет в точке максимум (или минимум), если эту точку можно окружить такой окрестностью (x₀- ,x₀+ ), содержащейся в промежутке, где задана функция, что для всех её точек выполняется неравенство.

f(x) < f(x₀)(или f(x)>f(x₀))

Иными словами, точка x₀ доставляет функции f(x) максимум (минимум), если значение f(x₀) оказывается наибольшим (наименьшим) из значений, принимаемых функцией в некоторой (хотя бы малой) окрестности этой точки. Отметим, что самое определение максимума (минимума) предполагает, что функция задана по обе стороны от точки x₀.

Если существует такая окрестность, в пределах которой (при x=x₀) выполняется строгое неравенство

f(x)<f(x₀)(или f(x)>f(x₀)

то говорят, что функция имеет в точке x₀ собственный максимум (минимум), в противном случае – несобственный.

Если функция имеет максимумы в точках x₀ и x₁ , то, применяя к промежутку [x₀,x₁] вторую теорему Вейерштрасса, видим, что наименьшего своего значения в этом промежутке функция достигает в некоторой точке x₂ между x₀ и x₁ и имеет там минимум. Аналогично, между двумя минимумами непременно найдется максимум. В том простейшем (и на практике – важнейшим) случае, когда функция имеет вообще лишь конечное число максимумов и минимумов, они просто чередуются.

Заметим, что для обозначения максимума или минимума существует и объединяющий их термин – экстремум.

Понятия максимум (max f(x)) и минимум (min f(x)) являются локальными свойствами функции и имеют место в определенной точке х₀. Понятия наибольшего (sup f(x)) и наименьшего (inf f(x)) значений относятся к конечному отрезку [a,b] и являются глобальными свойствами функции на отрезке.

Из рисунка 1 видно, что в точках х₁ и х₃ локальные максимумы, а в точках х₂ и х₄ – локальные минимумы. Однако, наименьшего значения функция достигает в точке х=а, а наибольшего – в точке х=b.

Поставим задачу о разыскании всех значений аргумента, доставляющих функции экстремум. При решении ее основную роль будет играть производная.

Предположим сначала, что для фунции f(x) в промежутке(a,b) существует конечная производная. Если в точке х₀ функция имеет экстремум, то, применяя к промежутку (х₀- ,х₀+ ), о которой была речь выше, теорему Ферма, заключаем, что f(x)=0 этом состоит необходимое условие экстремума. Экстремум следует искать только в тех точках, где производная равна нулю.

С геометрической точки зрения это означает, что касательная к графику функции в его вершине или впадине параллельна оси ОХ (рис.2)

Не следует, думать, однако, что каждая точка, в которой производная равна нулю, доставляет функции экстремум : указанное только что необходимое условие неявляется достаточным.

3.2.1.Достаточное услоие.Первый признак.

Дополним, что точки, где производная равна нулю, называются стационарными ; а точки, где производная не существует называются критическими.

Итак, если точка х₀ есть стационарная точка для функции f(x) или если в этой точке не существует для неё двусторонней конечной производной, то точка х₀представляется, так сказать лишь “подозрительной” по экстремуму и подлежит дальнейшему испытанию.

Это испытание состоит а проверке достаточных условий для существования экстремума, которые мы сейчас утановим.

Предположим, что в некоторой окрестности (х- ,х+ ) точки х₀ (по крайней мере, для х=х₀) существует конечная производная и как слева от х₀ , так и справа от х₀ (в отдельности) сохраняет определенный знак. Тогда возможны следующие три случая:

I f’(x)>0 при х<х₀ и f’(x)<0 при х>х₀, т. е. производная f’(x) при переходе через точку х₀ меняет знак плюс на минус. В этом случае, в промежутке [х₀- ,х₀] функция f(x) возрастает, a в промежутке [х₀,х₀+ ] убывает, так что значение f(x) будет наибольшим в промежутке [х₀- ,х₀+ ] , т. е. в точке х₀ функция имеет собственный максимум.

II f’(x)<0 при х<х₀ и f’(x)>0 при х>х₀ , т. е. производная f’(x) при переходе через точку х₀ меняет знак минус на плюс. В этом случае аналогично убеждаемся, что в точке х₀ функция имеет собственный минимум.

III f’(x)>0 как при х<х₀ так и при х>х₀ либо же f’(x) и слева и справа от х₀ , т. е. при переходе через х₀ , не меняет знака. Тогда функция либо всё время возрастает, либо всё время убывает; в любой юлизости от х₀ с одной стороны найдутся точки х, в которых f(x)<f(x₀), а с другой – точки х, в которых f(x)>f(x₀) так что в точке х₀ никакого экстремума нет.

Графическая иллюстрация простейших возможностей дана на рисунке 3 (а,б,в).

Итак, мы получаем правило для испытания “подозрительного” значения х₀ : подставляя в производную f’(x) сначала х<х₀ , а затем х>х₀, устанавливаем знак производной вблизи от точки х₀ слева и справа от неё; если при этом производная f’(x) меняет знак плюс на минус , то налицо максимум, если меняет знак с минуса на плюс, то – минимум ; если же знака не меняет, то экстремума вовсе нет.

Это правило полностью решает вопрос в том случае, когда в промежутке (а,b), как это обычно бывает, всего лишь конечное число стационарных точек или точек, где отсутствует конечная производная:

a<х₁<х₂<… <х_k<х_k+1<… <х_n<b (3.1)

именно ,тогда прежде всего, в любом промежутке (а,х₁), (х₁,х₂), … ,(х_k,х_k+1), … ,(х_n,b) существует конечная производная f’(x) и, кроме того, в каждом таком промежутке f’(x) сохраняет постоянный знак.Действинельно, если бы f’(x) меняла знак, например, в промежутке (х_k,х_k+1) , то по теореме Дарбу, она обращалась бы в нуль в некоторой точке между х_k и х_k+1, что невозможно, поскольку все корни производной уже содержатся в ряду точек (3.1).

Последнее замечание бывает полезно в некоторах случаях на практике: знак производной f’(x) во всем промежутке (х_k,х_k+1) определяется , если вычислить значение (или даже только установить знак) её в одной какой-либо точке этого промежутка.

3.2.2.Достаточное условие. Второй признак.

Нередко более удобным на практике оказывается другой признак существования экстремума, основанный на выяснении знака второй производной в стационарной точке.

Справедлива следующая теорема.

Теорема 3.1:Если х₀ есть стационарная точка функции f(x) и f’’(x)<0, то в точке х₀ функция иммет максимум,а если f’’(x)>0 , то функция имеет в точке х₀ минимум.

Доказательство: По определению второй производной

(f’(x)-f’(x₀)

f’’(x₀)=lim-------------

x-x₀

По условию теоремы f’(x)=0. Поэтому

f’(x)

f’’=lim----------

x-x₀

Допустим , что f’’(x)<0. Тогда по теореме о пределах функции найдётся такой интервал (x₀-,x₀+), в котором переменная величина f’(x)/(x-x₀) сохраняет знак своего предела, т. е. выполняется неравенство

f’(x)

----------<0 (x₀- <x<x₀+ )

x-x₀

Отсюда следует,что f’(x)>0 , если х-х₀<0, или х>х₀, и f’(x)<0, если х-х₀>0, или х>х₀. На оснавании первого достаточного признака существования экстремума заключаем, что в точке х₀ функция f(x) имеет максимум. Аналогично показывается, что условие f’’(x)>0 обеспечивает минимум функции f(x).

ч.т.д.

Таким образом получаем правило нахождения экстремумов (для дважды дифференцируемых функций):

1.Вычисляем первую производную f’(x) и из уравнения f’(x)=0 находим стационарные точки функции f(x).

2.Вычсляем вторую производную, и каждую стационарную точку х₀ подвергаем испытанию:

- если f’’(x)>0, то х₀ – точка минимума функции;

- если f’’(x)<0, то х₀ – точка максимума функции.

Замечание 1 : если f’’(x)=0 ,то это правило теряет силу и нужно воспользоваться первым признаком нахождения экстремумов. При этом экстремум может существовать , а может и не существовать.(Например, как для функции y=x³,так и для функции y=x⁴,вторая производная обращается в нуль в точке х=0, но первая из них не имеет экстремумов в точке х=0, а вторая имеет в ней минимум (рис.4)).

Однако в случае своей применимости второй признак окаывается весьма удобным : вместо рассмотрения знака функции f’(x) в точках, отличных от предполагаемой точки экстремума, он позволяет дать ответ по знаку функции f’’(x) в той же точке.

3.3.Использование высших производных.

В случае, когда f’’(x)=0 (f’(x)=0) экстремум может быть, а может и не быть. Рассмотрим общий случай.

Теорема 3.2:Пусть функция f:U(x₀) R, определенная в окрестности U(x₀) точки х₀, имеем в х₀ производные до порядка n включительно (n>1).

Если f’(x₀)=…=f ^(n-1)(x₀)=0 и f⁽ⁿ⁾(x₀)=0 , то при n нечетном в х₀ экстремума нет, а при n четном экстремум есть, причем это строгий локальный минимум, если f⁽ⁿ⁾(x₀)>0 , и строгий локальный максимум, если f ⁽ⁿ⁾(x₀).

Доказательство:Используя локальную фурмулу Тейлора

f(x)-f(x₀)=f⁽ⁿ⁾(x₀)(x-x₀)ⁿ+ (x)(x-x₀)ⁿ (3.2)

где (x) 0 при x x₀,будем рассуждать так же, как при доказательстве леммы Ферма. Перепишем (2) в виде

f(x)-f(x₀)=(f⁽ⁿ⁾(x₀)+ (x))(x-x₀)ⁿ (3.3)

Поскольку f⁽ⁿ⁾(x₀)=0,а (x) 0 при x x₀, сумма имеет знак fⁿ(x₀),когда х достаточно близок к х₀. Если n нечетно, то при переходе через х₀ скобка (х-х₀)ⁿ меняет знак и тогда изменяется знак всей правой , а следовательно, и левой части равенства (3.3). Значит, при n=2k+1 экстремума нет.

Если n четно, то (x-x₀)ⁿ>0 при x=x₀ и,следовательно, а малой окрестности точки х₀ знак разности f(x)-f(x₀), как видно из равенства (3.3), совпадает со знаком f⁽ⁿ⁾(x₀) :

- пусть f⁽ⁿ⁾(x₀),тогда в окрестности точки х₀ f(x)>f(x₀), т. е. в точке х₀ – локальный минимум;

- пусть f⁽ⁿ⁾(x₀)>0,тогда f(x)>f(x₀) ,т. е. в точке х₀ локальный минимум. ч.т.д.

4.Экстремумы функций трех переменных.

4.1.Необходимые условия экстремума.

Пусть функция v=f(x,y,z) определена в области D и (x⁰,y⁰,z⁰) будет внутренней точкой этой области.

Говорят, что функция v=f(x,y,z) в точке (x⁰,y⁰,z⁰) имеет максимум (минимум), если её можно окружить такой окрестностью

(x⁰- ,x⁰+ , y⁰- ,y⁰+ ,z⁰- ,z⁰+ )

что бы для всех точек этой окрестности выполнялось неравенство

f(x,y,z)<f(x⁰,y⁰,z⁰)

(>)

Если эту окрестность взять настлько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме самой точки (x⁰,y⁰,z⁰) выполнялось строгое неравенство

f(x,y,z)<f(x⁰,y⁰,z⁰)

(>)

то говорят, что в точке (x⁰,y⁰,z⁰) имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным.

Для обозначения максимума и минимума (как и в случае одной переменной) употребляется общий термин – экстремум.

Предположим, что наша функция в некоторой точке (x⁰,y⁰,z⁰) имеет экстремум,

Покажем, что если в этой точке существуют (конечные) частные производные

f_x’(x⁰,y⁰,z⁰), f_y’(x⁰,y⁰,z⁰) ,f_z’(x⁰,y⁰,z⁰)

то все эти частные производные равны нулю, так что обращение в нуль частных производныхпервого порядка является необходимым условием существования экстремума.

С этой целью положим y= y⁰,z= z⁰сохраняя х переменным ; тогда у нас получится функция от одной переменной х :

v=f(x, y⁰,z⁰)

Так как мы предположили, что в точке (x⁰,y⁰,z⁰) существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности (x⁰- ,x⁰+ ) точки x=x⁰, необходимо должно выполняться неравенство

f(x, y⁰,z⁰)<f(x⁰,y⁰,z⁰)

так что упомянутая выше функция одной переменной в точке будет иметь максимум, а отсюда по теореме Ферма следует, что

f_x’(x⁰,y⁰,z⁰)=0

Таким образом можно показать, что в точке и остальные частные производные равны нулю.

Итак, «подозрительными» на экстремум являются те точки, в которых частные производные первого порядка все обращаются в нуль: их координаты можно найти, решив систему уравнений

f_x’(x,y,z)=0

f_y’(x,y,z)=0 (4.2)

f_z’(x,y,z)=0

Как и в случае функции одной переменной, подобные точки называются стационарными.

4.2.Достаточное условие экстремума.

Как и в случае функции одной переменной, в стационарной точке вовсе не обеспечено наличие экстремума.Таким образом, встает вопрос об достаточных для существования (или отсутствия) экстремума в стационарной точке, то есть о том исследоовании, которому эта точка должна быть дополнительно подвергнута.

Предположим, что функция v=f(x,y,z) определена, непрерывна и имеет непрерывные частные производные первого и второго порядков в окрестности некоторой точки (x⁰,y⁰,z⁰), которая является стационарной, т.е. удовлетворяет условиям

f_x’(x⁰,y⁰,z⁰)=0,f_y’(x⁰,y⁰,z⁰)=0 ,f_z’(x⁰,y⁰,z⁰)=0

Чтобы установить, действительно ли наша функция имеет в точке (x⁰,y⁰,z⁰) экстремум или нет, естественно обратимся к рассмотрению разности

= f(x,y,z)- f(x⁰,y⁰,z⁰)

Разложим ее по формуле Тейлора,

= { f_x’’ x₁²+f_x’’ x₂²+…+f_x’’ x_n²+2f_x1x2’’ x₁x₂+ +2f_x1x3’’ x₁x₃+…+2f_xn-1xn’’ x_n-1x_n}= f_xixj’’ x_i x_j

где x= x_i-x_i⁰ ; производные все вычеслены в некоторой точке

(x₁⁰+0 x₁, x₂⁰+0 x₂,…, x_n⁰+0 x_n) (0<0<1)

Введём и здесь значения

f_xixj’’ (x₁⁰,x₂⁰,…,x_n⁰)=a_ik (i,k=1,2,…,n) (4.2)

так что

f_xixj’’ (x₁⁰+0 x₁, x₂⁰+0 x₂,…, x_n⁰+0 x_n)= a_ik+ _ik

_ik 0 при x₁0,…, x_n0 (4.3)

Теперь интеесующее нас выражение можно написать в виде:

= { a_ik x_i x_k+ _ik x_i x_k} (4.4)

На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке : он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных x₁,…,x_n. От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса.

В высшей алгебре квадратичную форму

a_ik y_iy_k (a_ik= a_ki) (4.5)

от переменных y₁,…,y_n называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю.

Необходимое и достаточное условие для того, чтобы форма (4.5) была определенной и положительной принадлежит Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:

a₁₁ a₁₂a₁₁ a₁₂ a₁₃

a₁₁>0, a₂₁ a₂₂ , a₂₁ a₂₂ a₂₃>0,

a₃₁ a₃₂ a₃₃

Так как определенная отрицательная форма с изменением знака всех её членов переходит в определенню положительную, и обратно, то отсюда легко найти и характеристику отицательной формы : она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого).

a₁₁ a₁₂a₁₁ a₁₂ a₁₃

a₁₁>0, a₂₁ a₂₂ a₂₁ a₂₂ a₂₃>0

a₃₁ a₃₂ a₃₃

Следовательно, чтобы исследовать точку М(x⁰,y⁰,z⁰) на экстремум , надо исследовать квадратичную форму ( 4.5).

Сформулируем полученный результат в виде теоремы.

Теорема : Пусть в некоторой области, содержащей точку М(x⁰,y⁰,z⁰), функция f(x,y,z) имеет непрерывные частные производные до второго порядка включительно; пусть кроме того, точка М(x⁰,y⁰,z⁰) является критической точкой функции f(x,y,z), т.е.

f(x⁰,y⁰,z⁰) f(x⁰,y⁰,z⁰) f(x⁰,y⁰,z⁰)

--------------- =0, ---------------=0, ---------------=0

x y z

Тогда при x=x⁰,y=y⁰,z=z⁰:

1) f(x,y,z) имеет максимум , если

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ²

---------------<0 , -------------------------------- - --------------- >0

x² x²y² xy

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ²

--------------- -------------------------------- - --------------- --

x² x²z² y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

-- --------------- -------------------------------- --

x y x y z²

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- --------------------------------- +

x z y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

+ --------------- -------------------------------- --

x z xy y z

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- ------------------------------- >0

x z y²

2) f(x,y,z) имеет минимум, если

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ²

--------------->0 , -------------------------------- - --------------- >0

x² x²y² xy

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ²

--------------- -------------------------------- - --------------- --

x² x²z² y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

-- --------------- -------------------------------- --

x y x y z²

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- --------------------------------- +

x z y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

+ --------------- -------------------------------- --

x z xy y z

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- ------------------------------- >0

x z y²

3)если

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ²

--------------- -------------------------------- - --------------- --

x² x²z² y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

-- --------------- -------------------------------- --

x y x y z²

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- --------------------------------- +

x z y z

² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰) ² f(x⁰,y⁰,z⁰)

+ --------------- -------------------------------- --

x z xy y z

² f(x⁰,y⁰,z⁰)² f(x⁰,y⁰,z⁰)

-- ------------------------------- =0

x z y²

то экстремум может быть , а может и не быть (в этом случае требуется дальнейшее исследование )

4) во всех остальных случаях f(x,y,z) не имеет ни максимума , ни минимума.

5.Экстремумы функций многих переменных.

5.1.Необходимые условия экстремума.

Пусть функция u=f(x₁,x₂,…,x_n) определена в области D и (x₁⁰,x₂⁰,…,x_n⁰) будет внутренней точкой этой области.

Говорят, что функция u=f(x₁,x₂,…,x_n) в точке (x₁⁰,x₂⁰,…,x_n⁰) имеет максимум (минимум), если её можно окружить такой окрестностью

(x₁⁰x₁⁰ x₂⁰x₂⁰ x_n⁰ x_n⁰)

что бы для всех точек этой окрестности выполнялось неравенство

f(x₁,x₂,…,x_n)<f(x₁⁰,x₂⁰,…,x_n⁰)

(>)

Если эту окрестность взять настлько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме самой точки (x₁⁰,x₂⁰,…,x_n⁰) выполнялось строгое неравенство

f(x₁,x₂,…,x_n)<f(x₁⁰,x₂⁰,…,x_n⁰)

(>)

то говорят, что в точке (x₁⁰,x₂⁰,…,x_n⁰) имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным.

Предположим, что наша функция в некоторой точке (x₁⁰,x₂⁰,…,x_n⁰) имеет экстремум,

Покажем, что если в этой точке существуют (конечные) частные производные

f_x1’(x₁⁰,x₂⁰,…,x_n⁰) ,…, f ’_xn(x₁⁰,x₂⁰,…,x_n⁰)

С этой целью положим x₂=x₂⁰,…,x_n= x_n⁰ сохраняя x₁ переменным ; тогда у нас получится функция от одной переменной x₁ :

u=f(x₁, x₂⁰,…,x_n⁰)

Так как мы предположили, что в точке (x₁⁰,x₂⁰,…,x_n⁰) существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности(x₁⁰- , x₁⁰+ ) точки x₁= x₁⁰, необходимо должно выполняться неравенство

f(x₁, x₂⁰,…,x_n⁰)< f(x₁⁰,x₂⁰,…,x_n⁰)

так что упомянутая выше функция одной переменной в точке x₁= =x₁⁰ будет иметь максимум, а отсюда по теореме Ферма следует, что

f_x1’(x₁⁰,x₂⁰,…,x_n⁰)=0

Таким образом можно показать, что в точке (x₁⁰,x₂⁰,…,x_n⁰)

и остальные частные производные равны нулю.

f_x1’(x₁⁰,x₂⁰,…,x_n⁰)=0

……………………. (5.1)

f ’_xn(x₁⁰,x₂⁰,…,x_n⁰)=0

Как и в случае функции одной переменной, подобные точки называются стационарными.

Замечения :Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать так :

d f(x₁,x₂,…,x_n)=0

так как, если f_x1’= f_x2’=…= f ’_xn , то каковы бы ни были dx₁,dx₂,…,dx_n всегда

f(x₁,x₂ d,…,x_n)= f_x1’ dx₁+ f_x2’ dx₂+…+ f ’_xn dx_n=0

И обратно : если в данной точке тождественно выполняется это условие, то ввиду произвольности dx₁,dx₂,…,dx_n производные f_x1’, f_x2’,…, f ’_xn порознь равны нулю.

Обычно, рассматриваемая функция f(x₁,x₂,…,x_n) имеет (конечные) частные производные во всей области, и тогда точки, доставляющие функции экстреммы, следует искать лишь среди стационарных точек. Однако встречаются случаи, когда в отдельных точках некоторые частные производные имеют бесконечные значения или вовсе не существуют (в то время как остальные равны нулю). Подобные точки, собственно, тоже следует причислить к «подозрительным» по экстремуму, наряду со стационарными.

Иногда дается и не прибегая к достаточным условиям выяснить характер стационарной точки функции. Так, если из условия задачи непременно следует, что рассматриваемая функция имеет где-то максимум или минимум и при этом системе уравнений (5.1) удовлетворяет только одна точка, то ясно, что эта точка и будет искомой точкой экстремума функции.

Заметим, наконец, что точками экстремума непрерывной функции могут быть точки, в которых функция недифференцируема (им соответствуюя, например, острия поверхности – графика функции).

5.2.Достаточные условия экстремума.

Так же как и для функции одной переменной, необходимый признак экстремума в случае многих переменных не является достаточным. Это значит, что из равенства нулю частных производных в данной точке вовсе не следует, что этаточка обязательно является точкой эксремума.

Достаточные условия экстремума для функций нескольких переменных носит значительно более сложный характер, чем для функции одной переменной.

Пусть функция f(x₁,x₂,…,x_n) определена, непрерывна и имеет непрерывные производные первого и второго порядковокрестности некоторой стационарной точки (x₁⁰,x₂⁰,…,x_n⁰).Разлагая разность

= f(x₁,x₂,…,x_n)-f(x₁⁰,x₂⁰,…,x_n⁰)

по формyле Тейлора, получим

= { f_x’’ x₁²+f_x’’ x₂²+…+f_x’’ x_n²+2f_x1x2’’ x₁x₂+ +2f_x1x3’’ x₁x₃+…+2f_xn-1xn’’ x_n-1x_n}= f_xixj’’ x_i x_j

где x= x_i-x_i⁰ ; производные все вычеслены в некоторой точке

(x₁⁰+0 x₁, x₂⁰+0 x₂,…, x_n⁰+0 x_n) (0<0<1)

Введём и здесь значения

f_xixj’’ (x₁⁰,x₂⁰,…,x_n⁰)=a_ik (i,k=1,2,…,n) (5.2)

так что

f_xixj’’ (x₁⁰+0 x₁, x₂⁰+0 x₂,…, x_n⁰+0 x_n)= a_ik+ _ik

_ik 0 при x₁0,…, x_n0 (5.3)

Теперь интеесующее нас выражение можно написать в виде:

= { a_ik x_i x_k+ _ik x_i x_k} (5.4)

В высшей алгебре квадратичную форму

a_ik y_iy_k (a_ik= a_ki) (5.5)

Необходимое и достаточное условие для того, чтобы форма (5.5) была определенной и положительной принадлежит ,как было уже сказано выше , Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:

a₁₁ a₁₂a₁₁ a₁₂ a₁₃a₁₁ a₁₂… a_1n

a₁₁>0, a₂₁ a₂₂ , a₂₁ a₂₂ a₂₃>0,…, a₂₁ a₂₂… a_2n

a₃₁ a₃₂ a_{33 …………………}

a_n1 a_n2… a_nn

Пользуясь этими понятиями. Сформулируем достаточные для существования экстремума условия :

Если второй дифференциал,т. е. квадратичная форма

a_ik x_ix_k (5.6)

со значениями (5.2) коэффициентов – оказывается определенной положительной (отрицательной) формой, то в используемой точке (x₁⁰,x₂⁰,…, x_n⁰) будет собственный минимум (максимум).

Для доказательства введем расстояние

= x₁²+…+ x_n²

между точками (x₁⁰,x₂⁰,…,x_n⁰) и (x₁,x₂,…,x_n). Вынося в (5.5) за скобку и полагая

x_i (i=1,2,…,n)

перепишем выражение для в виде

= { a_ik E_iE_k+ _ikE_iE_k} (5.7)

Числа E_i зараз не обращаются в нуль, поэтому, если форма (5.7) – положительная, первая сумма в скобках в формуле (5.7) иммет всегда положительный знак. Больше того, так как

E_i=1 (5.8)

то найдется такое постоянное положительное число m, что при всех возможных значениях E_i будет

a_ik E_iE_k>m

Действительно, эта сумма представляет собой непрерывную функцию от аргументов E_i во всем пространстве,в частности же и в множестве М тех точек(E₁,…, E_n), которые удовлетворяют соотношению (5.8) («сферическая поверхность»). Но множество это, как нетрудно видеть, замкнуто, т. е. содержит все свои точки сгущения ; а тогда, по теореме Вейерштрасса, названная сумма будет иметь в М наименьшее значение , необходимо положительное (как и все ее значения в М).

С другой стороны, ввиду (5.3) вторая сумма в (5.7) для достаточно малых ,очевидно, будет по абсолютной величине уже меньше m, так что вся скобка окажется положительной. Итак, в достаточно малой сфере, с центром в точке (x₁⁰,x₂⁰,…,x_n⁰) разность будет положительна, откуда и явствует, что в названной точке функция f(x₁,x₂,…,x_n) имеет собственный минимум.

Аналогично исчерпывается и случай, когда форма (5.6) будет определенной, но отрицательной.

Для того, чтобы квадратичная форма (5.6) была отрицательно определенной, необходимо и достаточно, чтобы

a₁₁ a₁₂a₁₁ a₁₂ a₁₃a₁₁ a₁₂… a_1n

a₁₁<0, a₂₁ a₂₂ , a₂₁ a₂₂ a₂₃<0,…,(-1)ⁿ a₂₁ a₂₂… a_2n

a₃₁ a₃₂ a_{33 …………………}

a_n1 a_n2… a_nn

5.3.Метод вычисления критериев Сильвестера.

Применение критерия Сильвестера для определения экстремума функции многих переменных требует вычисления определителей порядка. Рассмотрим один из возможных методов диагонализации матриц и соответственно получения треугольных определителей.Метод основан на последовательном понижении порядка определителя. При этом :

1.На каждом этапе понижения порядка определителя, удобная для применения вычислительной техники.

2.Получаемые в результате диагональные элементыопределителей являются элементами критерия Сильвестера и позволяют, так сказать, в «ходе вычисления» вести контроль знакоопределенности квадратичной формы.

В основу алгоритма вычислений положины два свойства определителей.

1.Известно, что

a₁₁ a₁₂

a₂₁ a₂₂

Впредь замена любого определителя второго порядка элементом a₁₁ назовем «сверткой» определителя.

2.Определитель порядка не изменится, если элементы какой-либо строки умножить (разделить) на какое-либо число, не равное нулю, и сложить (вычесть) с элементами другой строки.

Итак, рассмотрим определитель n-го порядка, составленный из вторых частных производных некоторой функции n– переменных f(x₁,x₂,…,x_n).

Положим a_ik= f_xixk’’.Имеем

a₁₁ a₁₂… a_1n

_{…………………} (5.9)

a_n1 a_n2… a_nn

Умножим в (5.9) элементы первой строки на a_21/ a₁₁ и вычтем их из элементов второй строки.

Умножим в (5.9) элементы первой строки на a_31/ a₁₁и вычтем их из элементов третьей строки. …

Умножим в (5.9) элементы первой строки на a_n1/ a₁₁ и вычтем их из элементов последней строки.

Выполнив последовательно эти операции, получим

a₁₁ a₁₂… a_1n

0 a₂₂- a₁₂ a_21/ a₁₁… a_2n -a_1n a_n1/ a₁₁

_{………………………………………………………}(5.10)

0 a_n2- a₁₂ a_n1/ a₁₁… a_nn- a_1n a_n1/ a₁₁

Умножим каждую строку в (5.10), начиная со второй на a₁₁,при этом определитель (5.10) умножится на a₁₁^n-2

----------- (5.11)

a₁₁^n-2

где

a₁₁ a₂₂- a₁₂ a₂₁a₁₁ a₂₃- a₁₃ a₂₁… a₁₁ a_2n- a_1n a₂₁

a₁₁ a₃₂- a₁₂ a₃₁a₁₁ a₃₃- a₁₃ a₃₁… a₁₁ a_13n- a_1n a₃₁

………………………………………………… (5.12)

a₁₁ a_n2- a₁₂ a_n1a₁₁ a_n3- a₁₃ a_n1… a₁₁ a_nn- a_1n a_n1

Рассмотрим более внимательно элементы (5.12). Перепишем (5.12) в виде

a₁₁ a₁₂… a_1n-1

a₂₁ a₂₂… a_2n-1

_{…………………} (5.13)

a_n-11 a_n-12… a_n-1n-1

Из сравнения (5.12) и(5.13) видно, что

a₁₁ – есть свертка определителя a₁₁ a₁₂

a₂₁ a₂₂

a₁₂ – есть свертка определителя a₁₁ a₁₃

a₂₁ a₂₃

…………………………………………………………..

a_1n-1 – есть свертка определителя a₁₁ a_1n

a₂₁ a_2n

Таким образом, первая строка _1n-1 является сверткой элементов первых двух строк определителя _n. Более наглядно это можно сфрмклировать так : последовательно каждый «прямоугольник» элементов первой и второй строк заменяется его сверткой ; причем первые элементы двух строк «участвуют» во всех прямоугольниках этих строк.

a₁₁ a₁₂a₁₃… a_1n

a₁₁ a₁₂ a_1n-1

a₂₁ a₂₂a₂₃… a_2n

Аналогично вторая строка определителя _n-1 является сверткой элементов первой и третьей строк исходного определителя.

a₁₁ a₁₂a₁₃… a_1n

a₂₁ a₂₂ a_2n-1

a₃₁ a₃₂a₃₃… a_3n

Наконец для последней строки _n-1 имеем

a₁₁ a₁₂a₁₃… a_1n

a_n-1
1 a_{n-1 2} a_n-1n-1

a_n1 a_n2a_n3… a_nn

Если теперь применить те же опервции к определителю _n-1, т. е. к (5.13), получим

a₁₁^n-3 (5.14)

где

a₁₁ a₁₂… a₁_n-2

a₂₁ a₂₂… a₂_n-2

_{…………………}_{…………..}

a_{n-2 1} a_{n-2 2}… a_{n-2 n-2}

а элементы a_ik являются сверткой соответствующих определителей – прямоугольников.

Очевидно, повторяя эту операцию n–1 раз, получим следующую формулу, предварительно введя более простые обозначения :

a₁₁ = a₁– левый угловой верхний элемент

a₁₁ = a₂ – левый угловой верхний элемент

a₁₁ = a₃ – левый угловой верхний элемент

…………………………………………

a₁₁ = a_n – левый угловой верхний элемент.

С учетом этого

a_n

a₁^n-2 a₂^n-3… a_n-1(5.15) n>2

Пример №1.

2 1 5 3

0 4 7 2 1 2*4-1*0 2*7-5*0 2*2-3*0 1 8 14 4

5 6 3 1 2²2*6-5*1 2*3-5*5 2*1-5*3 2² 7 –19 -13

0 2 1 3 2*2-0*1 2*1-5*0 2*3-3*0 4 2 6

4 7 2

7 –19 –13 1 4*(-19)-7*7 4*(-13)-2*7 1 -72-49 -52-14

2 3 1 4 4*1-2*7 4*3-2*2 4 -10 8

1 -121 -66 1 -121 -66 1

4 -10 8 2 -5 4 2 (-121*4-66*5)= -121*2-33*5=

= -242 –165= -407

Пример №2.

3 0 2 1 5

0 4 1 3 6 1 3*4-0*0 3*1-2*0 3*3-0*1 3*6-5*0

1 2 3 5 1 3³ 3*2-5*0 3*3-5*2 3*5-5*1 3*1-5*5

0 3 4 0 6 3*3-2*0 3*4-2*2 3*0-2*1 3*6-2*5

1 2 3 4 5 3*2-1*0 3*3-1*2 3*4-1*1 3*5-1*5

12 3 9 18 -30 66 -264-108

1 6 –1 10 -22 1 69 -105 96-162

3³ 9 8 -2 8 3³*12² 66 78 120-108

6 7 11 10

-30 66 -372 30*105-66*69 30*66+69*372

1 69 -105 -66 1 -30*78-66*66 -30*12+66*372

3³*12² 66 78 12 3³*12²*(-30)

1 3150-4554 1980+25668 1 -1404 27648

3³*12²*(-30) -2340-4356 -360+24552 3³*12²*(-30) –6696 24192

-1404*24192+6696*27648 33965568-182476800-2654208

3³*12²*(-30) 3³*12²*30

31311360-182476800 15116544 15116544

3³*12²*30 3³*12² 3888

=3888

Вычесленные в порядке получения определителий _n, _n-1, …, ₂ их верхние левые угловые элементы a₁,a₂,…,a_n являются критерием Сильвестера в части знаков, т.е.

sign a₁₁=sign a₁

sign a₁₁=sign a₂=sign a₁₁ a₁₂

a₂₁ a₂₂

…………………………….

a₁₁… a_1n

sign a₁₁=sign a_n=sign ………..

a_n1… a_nn

По сути метод дает возможность вычисления определителей . Однако нас интересуют лишь знаки определителей.Это существенно упрощает задачу.

Рассмотрим функцию f(x₁,x₂,…,x_n). имеющую экстремум,а именно максимум в точке М₀(x₁⁰,x₂⁰,…,x_n⁰).Это значит,что все коэффициенты a₁, a₂,…, a_n должны быть положительными. Поэтому процесс определения максимума функции в точке М₀ заканчивается на любом этапе понижения определителя ,если после положительных a₁, a₂,…, a_k коэффициент а_k+1 стал отрицательным или нулевым.

Если же в точке М₀ – минимум, то коффициенты a₁, a₂,…, a_n образуют знакочередующуюся последоватнльность, а именно

a₁<0, a₂>0, a₃<0,…

Аналогично процесс прекращается, если нарушается эта знакопеременность.

Итак, общая схема выглядит следующим образом :

1.Определяются стационарные точки функции, в которых

x_i i=1,2,3,….,n

2.Определяются коэффициенты а_ik в этих точках

²f

x_ix_r

3.Выясняем знак первого диагонального элемента а₁₁=а₁

а) если а₁₁>0, то все последующие элементы а₂,а₃,…,а_n должны быть положительными,если в точке М₀ действительно максимум

б)если а₁₁<0, то знаки последующих элементов а₂,а₃,…,а_n должны чередоваться, если в точке М₀ действительно минимум.

4.При нарушении какой-либо из закономерностей в п.3 процесс прекращается и формулируется вывод о том,что в точке М₀ экстремума нет.

Наконец отметим следующее важное обстоятельство. Так как коэффициенты а_ik являются частными производными второго порядка и для дифференцируемой функции с непрерывными ²f/ x_ix_r в соответствии с теоремой Шварца эти частные производные не зависят от порядка дифференцирования, то а_ik= а_ki. Это важное свойство приводит к тому, что матрица (а_ik) является симметрической вместе со своим определителем а_ikПокажем, что учет этого факта сокращант объем вычислений по крайней мере вдвое .

Во-первых, покажем, что определитель _n-1 также остается симметрическим,т. е. применяется операция понижения порядка инварианта и сохраняет это свойство при переходе от_n-1 к _n и т.д.

Диагональные элементы любого определителя, очевидно, равны сами себе.

Рассмотрим произвольный элемент а_ik в определителе _n-1, i=k, i,k=1,2,…,n-1.

а_ik= а_ik– а_{1 k} а_1i / а₁₁ (*)

Если переставить индексы i,k ,то

a_ki= а_ki– а_{1 i} а_1k / а₁₁ (**)

Сравнивая (*) и (**) видим, что из того, что а_ik= а_ki следует, что а_ik= а_ki. Этим доказано, что из того, что _n- симметрический определитель, определитель _n-1 также симметрический.Что это дает для вычисления _n-1 ?

Пусть вычислена первая строка коэффициентов а_1k(k=1,2,…,n-1) определителя _n-1 , т.е.

а₁₁, а₁₂, а₁₃,…, а_1n-1

Теперь вычислим первый столбец , он имеет вид

а₁₁

а₂₁

а₃₁

_…..

а_n-1
1

Но ввиду симметричности коэффициентов, этот столбец совпадает со строкой. Другими словами, сосчитав элементы первой строки, первый столбец уже считать нет необходимости, его нужно просто записать. Для наглядности запишем

a₁₁ a₁₂… a_{1 n-1}

a₂₁ a₂₂… a_{2 n-1}

_{………………….}

a_n1 a_n2… a_{n-1 n-1}

Вычислим теперь элементы второй строки, начиная с а₂₂ ,т.е. а₂₂, а₂₃, а₂₄,…, а_{2 n-1}.Эта строка полностью совпадает со вторым столбцом, начиная с а₂₂,т.е.

а₂₂

а₃₁

_…..

а_n-1
2

Итак, второй столбец автоматически заполняется элементами второй строки.Т.е. иммем

a₁₁ a₁₂а₁₃… a_{1 n-1}

a₂₁ a₂₂а₂₃… a_{2 n-1}

_n-1= a₃₁ a₃₂а₃₃… a_{3 n-1}

…………………………..

a_{n-1 1}a_{n-1 2}a_{n-1 3}… a_{n-1 n-1}

И т.д.

Общий вывод : необходимо расчитать лишь правую треугольную часть элементов. Нижняя же левая часть определителя заполняется автоматически. Формально ее можно вообще не заполнять, т.е. оставлять в виде

a₁₁ a₁₂а₁₃… a_{1 n-1}

a₂₂а₂₃… a_{2 n-1}

_n-1= а₃₃… a_{3 n-1}(5.16)

…………..

a_{n-1 n-1}

Отсюда для получения следующегоопределителя можно применить правило, условно назовем, треугольника.

a₁₁= a₁₁ a₂₂- a₁₂²

a₂₂= a₁₁ a₃₃- a₁₃² и т.д.

Для недиагоналных элементов схема несколько сложнее

a₁₂= a₁₁ a₂₃- a₁₃ a₁₂ a₁₁ a₁₂а₁₃

а₂₃ и т.д.

Пример №3.

Исследовать на экстремум функцию z=x³+y³-3xy

1.Находим

z z

---- и ----

y x

---- = 3x²-3y

---- = 3y²-3x

2.Находим стационарные точки, решая систему

3x²-3y=0

3y²-3x=0

Получили две стационарные точкм (0;0) и (1;1).

3.Находим

²z²z ²z

------- --------- --------

x² y² x y

²z²z ²z

------- =6x --------- =6y -------- = -3

x² y² x y

4.Для точки (0;0) имеем

a₁₁=0 a₂₂=0 a₁₂= a₂₁= -3

Для точки (1;1) иммем

b₁₁=6 b₂₂=6 a₁₂= a₂₁= -3

5.Находим

a₁₁ a₁₂ 0 -3

a₂₁ a₂₂ -3 0

b₁₁ b₁₂ 6 -3

b₂₁ b₂₂ -3 6

Так как <0 , то в точке (0;0) экстремума нет.

Так как >0 и a₁₁>0, то (1;1) – точка минимма функции, причем z_min = -1.

Пример №4.

Исследовать на экстремум функцию w=x^2/3+y^2/3+z^2/3

Ищем критические точки

2 2 2

w`_x= ------ w`_y= --------- w`_z= ----------

3 ³ x 3 ³ y 3 ³ z

Эти частные производные не обращаются в нуль ни при каких значениях x, y, z; они не сужествуют (обращаются в бесконечность) в точке P₀(0;0;0). Точка P₀ лежит внутри области определения функции w, которая представляет совокупность всех точек (x;y;z) пространства. Поэтому P₀ критическая точка.

Исследуя знак разности w(P)-w(P₀)= x^2/3+y^2/3+z^2/3 вблизи точки P₀, убеждаемся, что при любых отличных от нуля значениях x,y,z она сохраняет положительный знак. Поэтому P₀ есть точка минимума, w_min=w(P₀)=0

5.4.Экстремумы на множествах.

Следует обратить внимание на то, что мы указали необходимые и достаточные условия экстремума функции лишь во внутренней точке области определения. Таким образом, при отыскании абсолютного максимума или минимума функции необходимо наряду с внутренними критическими точками функции исследовать также точки границы области определения, поскрльку максимальное или минимальное значение функция может принять в одной из таких граничных точек.

Пусть функция f дифференцируема на открытом ограниченом G и непрерывна на его замыкании G. Пусть требуется найти наибольшее и наименьшее значения функции на множестве G. Для этого можно, например, найти все стационарные точки функции f в G, вычислить в них значения функции и выбрать, если, конечно это возможно (а теоретически возможно это, например, когда число стационарных точек конечно), точки, в которых функция принимает наибольшее и наименьшее значения из всех значений в стационарных точках. После этого следует сравнивать эти значения со значениями, которые функция принимает на границе открытого множества G, например, найдя, если это удается сделать, наибольшее и наименьшее значения функции f на границе области G. Сравнив наибольшее и наименьшее значения в стационарных точках с наибольшим и наименьшим значениями на границе множества G, мы можем, очевидно, найти искомый максимум и минимум f на G.

В случае, когда G – плоская область и ее граница является кривой, заданной некоторым представлением x=x(t), y=y(t), <t< вопрос о нахождении экстремальных значений функции f(x,y) на границе G сводится к исследованию на экстремум функции одного переменного f(x(t),y(t)), что делается уже известными нами методами.

Методы, которые можно применять в многомерном случае для отыскания экстремальных точек на границе области будут рассмотрены позже (см. раздел, посвященный условному экстремуму).

Полезно лишь иметь ввиду, что при отыскании максимумов и минимумов часто наряду с формальной техникой, а иногда и вместо нее можно использовать некоторые простые соображения, связанные с природой задачи. Например, если рассматриваемая в Rⁿ дифференцируемая функция по смыслу задачи должна иметь минимум и вместе с тем она не ограничена сверху, то при условии, что функция имеет единственную критическую точку, можно без дальнейшего исследования утверждать, что в этой точке она принимает минимальное знычение.

6.Условный экстремум.

6.1.Постановка вопроса.

Одним из наиболее ярких популярных достижений дифференциального исчисления являются предполагаемые им рецепты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось к внутренним экстремумам.

Иными словами, эти результаты применимы только к исследованию поведения функции Rⁿ x f(x) R в окрестности точки тогда, когда аргумент может принимать любое значение из некоторой окрестности Rⁿ в точки x₀.

Часто возникает более сложная и с практической точки зрения даже более интересная ситуация,когда ищется экстремум функции при некоторых условиях, ограничивающих область измерения аргумента. Типичным примером может служить изопериметрическая задача, когда ищется тело, имеющее максимальный объем при условии, что ограничивающая его поверхность имеет заданную площадь. Чтобы получить доступную нам математичкую запись такой задачи, упростим постановку и будем считать, что задача состоит в том, чтобы среди прямоугольников, имеющих заданный периметр 2р, найти тот, который имеет наибольшую площадь . Обозначив через х и у длины сторон прымоугольника, запишем, что

(х,у)=х-у

х+у=р

Итак, надо найти экстремум функции (х,у) при условии, что переменные х,у связаны соотношением х+у=р. Таким образом, экстремум функции ищется только на множестве тех точек плоскости R², которые удовлетворяют указанному соотношению. Эта конкретная задача, конечно, решается без труда : достаточно, записав, что у=р-х, подставить это выражение в формулу для (х,у) и найти обычными методами максимум функции х(р-х). Она нам была нужна лишь для постановки вопрса. В следующих пунктах мы рассмотрим общий случай решения подобных задач.

6.2.Понятие условного экстремума.

Пусть на открытом множестве G Rⁿ заданы функции.

y_i=f_i(x) i=1,2,3,…,m (6.1)

x=(x₁,x₂,…,x_n).Обозначим через Е множество точек x G , в которых все функции f_i i=1,2,3,…,m обращаются в нуль:

E={x: f_i(x)=0, i=1,2,3,…,m, x G} (6.2)

Уравнения

f_i(x)=0, i=1,2,3,…,n (6.3)

будем называть уравнениями связи.

Определение : пусть на множестве G задана функция y=f₀(x) .Тогда x⁽⁰⁾ E называется точкой условного экстремума (принят также термин «относительный экстремум») функции f₀(x) относительно (или при выполнении) уравнений связи (6.3) , если она является точкой обычного экстремума этой функции , рассмотриваемой только на множестве Е.

Иначе говоря , здесь значения функции f₀(x) в точке x⁽⁰⁾сравниваются не со всеми ее значениями в достаточно малой окрестности этой точки , а только со значениями в точках , принадлежащих одновременно указанной достаточно малой окрестности и множеству Е. Как и в случае обычных экстремумов , можно , естественно , рассматривать точки просто условного экстремума и точки строго условного экстремума.

Будем предполагать , что

1) все функции f₀,f₁,f₂,…, f_m непрерывно дифференцируемы в открытом множестве G ;

2) в рассматриваемой точке x⁽⁰⁾векторы f₁, f₂,…, f_m линейно независимы , т.е. ранг матрицы Якоби

f_j j=1,2,…,m

x_i i=1,2,…,n

равен m-числу ее строк (строки матрицы Якоби являются компонентами градиентов f₁, f₂,…, f_m).

Это означает , что функции системы (6.1) независимы в некоторой окрестности точки x⁽⁰⁾.Поскольку в n-мерном пространстве не может быть больше чем n линйено независимых векторов и ранг матрицы не может быть больше чиола столбцов , то из условия 2) следует ,что m<n.

Согласно условию 2) в точке x⁽⁰⁾ хотя бы один из определителей вида

(f₁, f₂,…, f_m)

(x_i1,x_i2,…,x_im)

отличен от нуля.Пусть для определенности в точке x⁽⁰⁾.

(f₁, f₂,…, f_m)

(x_i1,x_i2,…,x_im) (6.4)

Тогда , в силу теоремы о неявных функциях , систему уравнений (6.3) в некоторой окрестности точки x⁽⁰⁾=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾) можно разрешить относительно переменных x₁,x₂,…,x_m :

x₁= ₁( x₁,x₂,…,x_m)

x₂= ₂( x₁,x₂,…,x_m)

…………………… (6.5)

x_m= _m( x₁,x₂,…,x_m)

Поставив значения x₁,x₂,…,x_m, даваемые формулами (6.5) в y=f₀(x), т.е. рассмотрев композицию функции f₀ и ₁, получили функцию

y= f₀( ₁( x_m+1,…,x_n),…, _m( x_m+1,…,x_n), x_m+1,…,x_n)== =0( x_m+1,…,x_n) (6.6)

от n-m переменных x_m+1,…,x_n,определенную и непрерывно дифференцируемую в некоторой окрестности точки x⁽⁰⁾=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾) в (n-m)–мерном пространстве R^n-m.

Поскольку , согласно теореме о неявных функциях , условия (6.3) и (6.5) равносильны ,то справедливо следующее утверждение.

Точка x⁽⁰⁾является точкой (строгого) условного экстремума для функции g относительно уравнений связи (6.3) в том и только том случае , когда x⁽⁰⁾ является точкой обычного (строгого) экстремума (6.6).

Если x⁽⁰⁾– точка обычного экстремума функции g, то она является стационарной точкой этой функции:

dg (x⁽⁰⁾)=0 (6.7)

Напомним , что дифференциал – линейная однородная функция и его равенство нулю означает равенство нулю этой функции при любых значениях ее аргументов , в данном случае – при любых dx_m+1, dx_m+2,…, dx_n.Это возможно ,очевидно , в том и только том случае , когда все коэффициенты при этих аргументах , т.е. производные g/ x_m+k, k=1,2,…,n-m обращаются в нуль в точке x⁽⁰⁾.Условие (6.7) необходимо для условного экстремума в точке x⁽⁰⁾.

Таким образом , метод , основанный на решение системы уравнений (6.3) через элементарные функции часто невозможно или весьма затруднительно; поэтому желательно располагать методом , позволяющим найти условный экстремум не решая системы (6.3).Такой способ ,так называемый метод множетелей Лагранжа , изложен в следующем пункте .

6.3.Метод множетелей Лагранжа для нахождения точек условного экстремума.

В этом пункте будем предполагать , что все функции f₀,f₁,f₂,…, f_m непрерывно дифференцируемы в открытом множестве G.

Теорема 6.1 : пусть x⁽⁰⁾– точка условного экстремума функции f₀ при выполнении уравнений связи (6.3).Тогда в этой точке градиенты f₁, f₂,…, f_m линейно независимы , т.е. существуют такие не все равные нулю , числа ₀, ₁, ₂,…, _m что

₀ f₀+ ₁f₁+ ₂f₂+…+ _mf_m=0 (6.8)

Следствие : если в точке x⁽⁰⁾ условного экстремума функции f₀ относительно уравнений связи (6.3) градиенты f₁, f₂,…, f_m линейно независимы , то ранг матрицы Якоби

f_j j=1,2,…,m

x_i i=1,2,…,n

равен m, то существуют такие ₁,…, _m , что в этой точке

f₀+ _i f_j=0 (6.9)

т.е. f₀является линейной комбинацией градиентов f₁, f₂,…, f_m.

В координатной форме это условие имеет вид : для любого i=1,2,…,n в точке x⁽⁰⁾

f₀ f_i

x_ix_i (6.10)

функция

F(x)==f₀(x)+ _jf_j(x) (6.11)

где числа ₁,…, _m удовлетворяют условию(6.10), называется функцией Лагранжа рассматриваемой задачи , а сами числа ₁,…, _m – множителями Лагранжа.

Условие (6.10) означает , что если x⁽⁰⁾ является точкой условного экстремума функции f₀ относительно уравнений связи (6.3) , то она является стационарной точкой для функции Лагранжа , т.е.

F(x⁽⁰⁾)

x_ii=1,2,…,n (6.12)

Прежде , чем доказать теорему , разъясним ее смысл и покажем , как ее использовать для нахождения точек условного экстремума. Прежде всего обратим внимание на то , что у функции вида (6.11) при произвольных числах ₁,…, _m, каждая точка ее условного экстремума является и точкой условного экстремума исходной функции f₀, и наоборот.Мы выбираем такие значения ₁,…, _m, чтобы выполнялись условия (6.10) , т.е. чтобы данная точка условного экстремума оказалась и стационарной точкой фуцнкции (6.9).

Для отыскания точек условного экстремума следует рассмотреть систему n+m уравнений (6.3) и (6.8) относительно неизвестных x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾, ₁,…, _m и решить ее (если это возможно) , найдя x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾ и по возможности исключив ₁,…, _m.Сформулированная теорема утверждает , что все точки условного экстремума будут находится среди найденных таким образом точек (x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾).Вопрос о том , какие же из них фактически будут точками условного экстремума , требует дополнительного исследования , об этом будет говориться в п.6.5

Доказательство теоремы . Докажем утверждение равносильное теореме : если в точке x⁽⁰⁾=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾), удовлетворяющей уравнениям связи

f_k(x⁽⁰⁾)=0 k=1,2,…,n (6.13)

градиенты f₀, f₁, f₂,…, f_m линейно независимы , то x⁽⁰⁾не является точкой условного экстремума.

Итак , пусть f₀, f₁, f₂,…, f_m линейно независимы и , следовательно , ранг матрицы Якоби f_j/ x_i j=1,2,…,m,i=1,2,…,n равен m+1.Тогда в матрице существует минор порядка m+1 не равный нулю.Для определенности будем считать , что он образован первыми m+1 столбцами , т.е.

(f₀, f₁, f₂,…, f_m)

(x₁,x₂,…,x_m+1) x=x⁽⁰⁾ (6.14)

Множество G–открыто , а поэтому существует такое 0₀>0, что при всех 0 0<0<0₀, куб

Q ⁿ={x: x_i-x_i⁽⁰⁾ <0,i=1,2,…,n}

лежит в G и , следовательно, на нем определены все функции f₀, f₁, f₂,…, f_m.

Зафиксируем x_m+2= x⁽⁰⁾_m+2,…, x_n=x_n⁽⁰⁾ и введем обозначения

x^*=(x₁,x₂,…,x_m+1)

Q^m+1={x^*: x_i-x_i⁽⁰⁾ <0,i=1,2,…,m+1}

Очевидно , функции f_j(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾) j=1,2,…,m определены и непрерывно дифференцируемы всюду в Q^m+1.Рассмотрим отображение Ф : Q^m+1 R^m+1, задаваемое формулами

y₁= f₀(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

y₂= f₁(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

…………………………………… (6.15)

y_m+1= f_m(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

В силу (6.15) для точки x^*(0)=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾) имеем

(y₁, y₂,…, y_m+1) (f₀, f₁, f₂,…, f_m)

(x₁,x₂,…,x_m+1) x^*= x^*(0) (x₁,x₂,…,x_m+1) x=x⁽⁰⁾

а в силу (6.13) Ф(x^*(0))=(f₀(x⁽⁰⁾,0,…,0) .Поэтому (в силу теремы о локальной обратимости непрерывно дифференцируемого отображения в точке , в которой его якобиан не равен нулю , существует такое число >0 , что на окрестности

V={y=(y₁, y₂,…, y_m+1) : y₁- f₀(x⁽⁰⁾) < , y_j< ,j=2,3,…,m}

(рис.5) определено обратное к Ф отображение и , следовательно , в любую точку этой окрестности отображается какая-то точка из Q^m+1.

В частности , поскольку при любом n,0<n< ,имеет место включение (f₀(x⁽⁰⁾)+n,0,…,0), то в кубе найдутся точки x`^*=(x`₁,x`₂,…,x`_m+1) и x``^*=(x``₁,x``₂,…,x``_m+1), отображающиеся при отображении Ф в указанные точки окрестностиV`.

Ф(x`^*)=(f₀(x⁽⁰⁾)+n,0,…,0)

Ф(x``^*)=(f₀(x⁽⁰⁾)-n,0,…,0)

Если положим для краткости x`=(x`₁,x`₂,…,x`_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾) и x``=(x``₁,x``₂,…,x``_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾), то в координатной записи (6.15) получим

f₀(x`)= f₀(x⁽⁰⁾)+n> f(x⁽⁰⁾) , f_k(x`)=0, k=1,2,…,n , x` Q ⁿ

f₀(x``)= f₀(x⁽⁰⁾)-n> f(x⁽⁰⁾) , f_k(x``)=0, k=1,2,…,n , x`` Q ⁿ

В силу произвольности 0>0,0<0<0 , это и означает , что x⁽⁰⁾не является точкой условного экстремума.

ч.т.д.

Доказательство следствея. Если векторы f₁, f₂,…, f_m линейно независимы , то в равенстве (6.8) имеем ₀=0 так как в случае ₀=0 указанные векторы в силу (6.8) оказались бы линейно зависимыми .Разделив обе части на ₀ получим равенство вида (6.9).

ч.т.д.

Пример №5.

Пусть требуется найти экстремум функции u=xyzt при условии x+y+z+t=4c; область изменения переменных определяетссся неравенствовами x>0, y>0, t>0, z>0.

Применяя к этой задаче метод Лагранжа, введем вспомогательную функцию

Ф=xyzt+ (x+y+z+t)

И составим условия

Ф_x =yzt+ =0

Ф_y =xzt+ =0

Ф_z =yxt+ =0

Ф_t =yzx+ =0

откуда

yzt=xzt=xyt=xyz

так что

x=y=z=t=c.

6.4.Стационарные точки функции Лагранжа.

В этом пункте будет дано описаие стационарных точек функции Лагранжа (6.10) посредством фукции 0(x_m+1,x_m+2,…,x_n), введенной в пункте 6.2 (см.(6.8)).Предварительно докажем одну простую лемму из линейной алгебры.

Пусть задана система линейных однородных уравнений

a_i1x₁+…+ a_inx_n=0 i=1,2,…,m (6.16)

и еще одно линейное однродное уравнение

b₁x₁+…+ b_nx_n=0 (6.17)

Cистему уравнений , полученную присоединением к системе (6.16) уравнения (6.17), будем называть расширенной системой (6.16)-(6.17).

Лемма: Для того чтобы расширенная система (6.16)-(6.17) была равносильна основной системе (6.16) необходимо и достаточно , чтобы уравнение (6.17) являлось линейной комбинацией уравнений системы (6.16).

Следствие:Для того чтобы уравнение (6.17) было линейной комбинацией уранений (6.16) или , что то же самое , чтобы вектор

b==(b₁,…,b_n) (6.18)

был линейной комбинацией векторов

a_i ==(a_i1,…,a_in) i=1,2,…,m (6.19)

необходимо и достаточно , чтобы каждое решение системы (6.16) являлось решением уравнения (6.17).

Доказательство леммы . Пусть ранг матрицы (a_ij) коэффициентов системы (6.16) равен m₀ . Очевидно , что m₀<m . Если m₀<m, то уравнений системы (6.16) являются линейными комбинациями остальных. Отбросив те m-m₀ линейных уравнений , которые являются линейными комбинациями оставшихся , получили систему из m₀линейно независимых уравнений . равносильную системе (6.16), причем уравнение (6.17) является линейной комбинацией уравнений системы (6.16) тогда и только тогда , когда оно является линейной комбинацией указанной системы из оставшихся m₀ уравнений. Поэтому будем с самого начала считать , что , m₀=m т.е. что ранг матрицы (a_ij) коэффициентов системы (6.16) равен m– числу уравнений этой системы.

Пусть система (6.16) и (6.16)-(6.17) равносильны. Это означает, что пространства их решений совпадают.Поскольку все уравнения основной системы (6.16) входят в расширенную систему (6.16)-(6.17), то каждое решение расширенной системы является и решением основной системы , т.е. пространство решений расширенной системы содержится в пространстве решений основной системы. Следовательно , слвпадение этих пространств равносильно равенству их размерностей.

Размерность s пространства решений системы линейных днородных уравнений равны , как известно , числу неизвестных n этой системы , из которого вычтем ранг r матрицы коэффициентов системы : s=n-r.Отсюда следует , что равносильность систем (6.16) и (6.16)-(6.17) означает равенство рангов их матриц.Ранг матрицы коэффициентов системы (6.16) по условию равен m , т.е. векторы (6.19) линейно независимы.

Ранг матрицы коэффициентов расширенной системы (6.16)-(6.17) согласно сказанному в наших условиях также равен m.Поэтому векторы (см.(6.18) и (6.19))

b, a₁,…, a_m (6.20)

линейно зависимы.А это означает , что b является линейной комбинацией векторов a₁,…, a_m.

В самом деле , линейная зависимость векторов (6.20) означает , что существуют такие числа _{0, 1},…, _m, не все равные нулю . что

₀b+ ₁a₁+…+ _ma_m=0 (6.21)

Здесь заведамо ₀=0, так как в противном случае векторы a₁,…, a_m оказались бы линейно зависимыми. Поделив равенство (6.21) на ₀, получим , что b является линейной комбинацией векторов a₁,…, a_m .

Обратно, если b является линейной комбинацией векторов (6.19), то в системах векторов (6.19) и (6.20) имеется в точности по m линейно независимых векторов , т.е. ранги матриц коэффициентов систем уравнений (6.16) и (6.16)-(6.17) равны.

Итак, условие , что вектор b является линейной комбинацией векторов (6.19) :

₁a₁+…+ _ma_m=b

эквивалентно равенству рангов матриц коэффициентов рассматриваемых основной и расширенной системв уравнений, следовательно, эквивалентно их равносильности.

ч.т.д.

Доказательство следствия сразу следует из леммы, поскольку системы (6.16) и (6.16)-(6.17) очевидно равносильны тогда и только тогда , когда каждое решение системы (6.16) является и решением уравнения (6.17) – остальные уравнения систем просто совпадают.

ч.т.д.

Замечание 1 : доказанная лемма и ее следствие имеют простую геометрическую интерпритацию в n–мерном евклидовом векторном пространстве Rⁿ, т.е. в n–мерном пространстве со скалярным произведением.Используя обозначение скалярного произведения, систему (6.16) можно записать в виде

(a_i,x)=0 i=1,2,…,m (6.22)

а уравнение (6.17) в виде

(b,x)=0 (6.23)

где векторы a₁,…, a_m и определены в (6.18) и (6.19) , а x=(x₁,x₂,…,x_m+1)

Множество всевозможных линейных комбинаций векторов a₁,…, a_m образуют подпространство пространства Rⁿ и называется подпространством, натянутым на эти векторы.Обозначим его через Z=( a₁,…, a_m).

Множество решений системы (6.22) состоит из всех векторов х, ортоганальных подпространству Z=( a₁,…, a_m) Обозначим это множество решений через Т.Оно также является подпространством пространства Rⁿ.

Подпространства L==Z(a₁,…, a_m) и Т называются ортоганальными дополнениями друг друга в пространстве Rⁿ.

Поскольку L=Z( a₁,…, a_m), то представимость вектора b в виде линейной комбинации векторов a₁,…, a_m равносильна его принадлежности подпространству L пространства Rⁿ:b L.Это условие в свою очередь, равносильно ортоганальности вектора b подпространству Т:b _Т, которая означает, что для всех x Т имеет место равенство (b,x)=0,т.е.что любое реение х системы (6.22) является решением уравнения (6.23).Это и является утверждением следствия леммы.

Замечание 2 : напомним метод, которым можно получить все решения однородной системы линейных уравнений.Пусть система (6.16) состоит из линейно независимых уравнений.Тогда ранг матрицы его коэффициентов равен m.Это означает , что существует минор этой матрицы порядка m, не равный нулю.Пусть для определенности

a₁₁… a_1m

a_m1… a_mm (6.24)

В этом случае все решения системы (6.16) можно получить , задавая произвольно последние n-m координаты вектора (x₁,x₂,…,x_n). Остальные координаты однозначно находятся из системы уравнений (6.16).В самом деле, возьмем произвольное решение (x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾) системы (6.16).После подстановки x_m+1= x⁽⁰⁾_m+1,…, x_n= x_n⁽⁰⁾ в (6.16) получится система из m линейных уравнений (с m неизвестными x₁,x₂,…,x_n), матрицы коэффициентов которой в силу условия (6.24) невырожденная.Поэтому существуют единственные значения x₁,x₂,…,x_n, удовлетворяющие получившейся системе.Поскольку (x⁽⁰⁾₁,x⁽⁰⁾₂,…,x⁽⁰⁾_n). также было решением системы (6.16), то x₁=x⁽⁰⁾₁, x₂=x⁽⁰⁾₂,…, x_m=x⁽⁰⁾_m.

Перейдем теперь к анализу стационарных точек функции Лагранжа.

Теорема 6.2: Пусть функции f₀, f₁, f₂,…, f_m непрерывно дифференцируема в области G Rⁿ, x⁽⁰⁾ G

f_i(x)=0, i=1,2,3,…,n

а ранг матрицы Якоби функций f₁, f₂,…, f_m в точке x⁽⁰⁾ равен m.Для того чтобы в точке x⁽⁰⁾=(x⁽⁰⁾₁,x⁽⁰⁾₂,…,x⁽⁰⁾_n) градиент f₀ являлся линейной комбинацией градиентов f₁, f₂,…, f_m необходимо и достаточно, чтобы точка x⁽⁰⁾=(x⁽⁰⁾₁,x⁽⁰⁾₂,…,x⁽⁰⁾_n) была стационарной точкой для функции.

g(x)=g(x_m+1,…,x_n)

Напомним,что если в точке x⁽⁰⁾ градиент f₀ является линейной комбинацией

f₀= ₁f₁+ ₂f₂+…+ _mf_m (6.25)

градиентов f₁, f₂,…, f_m, то это равносильно тому, что существует функция Лагранжа

F= f₀- ₁f₁- ₂f₂-…- _mf_m (6.26)

для которой точка x⁽⁰⁾ является стационарной :

F(x⁽⁰⁾)

x_i i=1,2,…,n (6.27)

Это просто координатная запись (6.25) ,ибо в силу (6.26)

F(x⁽⁰⁾) f₀ f₁ f₂ f_m

x_i x_i x_i x_i x_i i=1,2,…,m

Доказательство: По условию ранг матрицы Якоби системы функций f₁, f₂,…, f_m в точке x⁽⁰⁾ равен m .Будем считать для определенности , как и в пункте 6.2 ,что

(f₁, f₂,…, f_m)

(x₁,x₂,…,x_m) x⁽⁰⁾ (6.28)

Подставим в уравнение связи (6.3) функции (6.5) , являющиеся решением этих уравнений , и продеффиренцируем получившееся относительно переменных x_m+1,…,x_n тождества.Получим для точки x⁽⁰⁾ равенства df_i(x⁽⁰⁾)=0, i=1,2,…,m, справедливые для любых приращений dx_m+1,…,dx_n независимых переменных x_m+1,…,x_n (напомним, что дифференциал являетсся линейной функцией , определенной на всем пространстве)Использовав инвариантность формы первого дифференциала относительно выбора переменных , получим , что в точке выполняется равенство

f_i f_i f_i f_i i=1,2,…,m

x₁ x_m x_m+1 x_n (6.29)

где x_m+1,…,x_n произвольные , а x₁,…,x_m находятся изформул (6.5). Таким образом вектор dx=( dx₁,…,dx_m,dx_m+1,…,dx_n) является решением линейной однородной системы (6.29).

Отметим , что в силу условия (6.28) значения dx₁,…,dx_m при заданных dx_m+1,…,dx_n однозначно находятся и из системы (6.29). Из замечания 2 следует также , что указанным способом получаются все решения системы (6.29).

Стационарность точки x⁽⁰⁾ для функции g(x)=g(x_m+1,…,x_n)

означает , что dg(x⁽⁰⁾).Это равенство , в силу инвариантности формы первого дифференциала, можно более подробно записать в виде

f₀ f₀ f₀ f₀

x₁ x_m x_m+1 x_n (6.31)

где dx_m+1,…,dx_n можно задавать произвольно, а dx₁,…,dx_m следует находить из формул (6.5) или , что дает тотже результат из формул (6.29). Инач говоря , любое решение системы уравнений (6.29) является и решением уравнения (6.31). Согласно следствию из леммы это возможно тогда и тoлько тогда , когда уравнение (6.31) является линейной комбинацией уравнений системы (6.29) , т.е. когда существуют такие числа , что

f₀= ₁f₁+ ₂f₂+…+ _mf_m

ч.т.д.

Замечание 3 : Согласно замечанию 2 совокупность всех решений систеиы уравнений (6.29) образуют подпространство Т пространства Rⁿ, являющееся ортогональным дополнением к подпространству L=Z( f₁, f₂,…, f_m) . Любой вектор y T ортогонален каждому градиенту f_i, а поэтому его естественно назвать касательным вектором в точке x⁽⁰⁾к гиперповерхности f_i(x)=0 , являющиеся множеством уровня функций f_i,i=1,2,…,m.

Таким образом , пространство решений Т системы (6.29) состоит из векторов , касательных одновременно ко всем гиперповерхностям f_i(x)=0 ,i=1,2,…,m, и потому его называют касательным пространством персечений всех гиперповерхностей f_i(x)=0 ,i=1,2,…,m . Напомним , что векторы касательноо пространства Т ,т.е. решения системы (6.29), были обознаены через dx (см.(6.30)).

Поскольку в точке условного экстремума согласно теореме 2 имеет место включение

f₀ L=Z( f₁, f₂,…, f_m)

то

f₀ T

Иначе говоря, градиент f₀ одновременно ортогонален всем касательным dx к гиперповерхностям f_i(x)=0 ,i=1,2,…,m:

( f₀,dx)=0

(это другая запись уравнения (6.31)), т.е. градиент f₀перпендикулярен касательному пространству Т в точке x⁽⁰⁾ .Но множество всех векторов , ортогональных к f₀, образуют (n-1)– мерное пространство Т₀ , называемое касательным пространством к гиперповерхности f₀(x)= f₀(x⁽⁰⁾) .В силу сказанного выше , каждый вектор из Т , будучи ортогонален градиенту f₀, принадлежит к Т₀ , т.е. Т Т₀.

Итак , если x⁽⁰⁾ – точка условного экстремума , то . Т Т₀ , т.е. касательное пространство в точке x⁽⁰⁾ пересечения всех гиперповерхностей , задаваемых уравнениями связи , содержится в касательном пространстве в той же точке гиперповерхности.

Замечание 4 : Из теоремы 2 еще раз вытекает следствие теоремы 1.В самом деле , если x⁽⁰⁾ является точкой условногo экстремума , то является x⁽⁰⁾ точкой обычного экстремума для функции () и , следовательно , ее стационаоной точкой . Поэтому согласно теореме 2 точка x⁽⁰⁾ является стационарной точкой для функции Лагранжа , т.е.выполняется условие .

6.5.Достаточные условия для точек условного экстремума.

В этом пункте также будем предполагать выполненными все предположения , наложенные на функции в пункте 6.2.Пусть

F= f₀+ _if_i

-функции Лагранжа (см.(6.11)) для функции f₀ и уравнений связи(6.3).Пусть x⁽⁰⁾ G удовлетворяет уравнениям связи (6.3) и является стационарной точкой функции Лагаранжа , т.е. точкой , координаты которой удовлетворяют системе уравнений (6.10) и (6.3). Нашей целью является получение метода , с помощью которого можно установить условия , достаточные для того , чтобы x⁽⁰⁾ являлась точкой условного экстремума рассматриваемой задачи.

Заметим прежде всего , что если точка x G удовлетворяет уравнениям связи (6.3) , то

f= f(x)-f(x⁽⁰⁾)=F(x)-F(x⁽⁰⁾)= F (6.32)

Отсюда сразу видно , что если x⁽⁰⁾ является точкой обычного экстремума для функции F, т.е. F не меняет знака в некоторой окрестности точки x⁽⁰⁾, то x⁽⁰⁾ является точкой условного экстремума для функции f₀ .

Действительно , из (6.32) следует в этом случае , что приращение f₀для допустимых значений х , т.е. удовлетворяющих уравнениям связи , также не меняет знак, Это достаточное условие , однако , накладывает слишком сильное ограничение на поведение функции Лагранжа F(x) в рассматриваемой точке – она должна иметь обычный экстремум , что сильно сужает область возможного применения указанного условия при решении задач.Поэтому целесообразно получить более общий достаточный признак условного экстремума .

Пусть x⁽⁰⁾= (x⁽⁰⁾₁,x⁽⁰⁾₂,…,x⁽⁰⁾_n) удовлетворяет уравнениям связи (6.3).Вернемся к рассмотрению функции (6.6) , т.е. функции g(x)=g(x_m+1,…,x_n) , получаемой из f₀(x)= f₀(x₁,x₂,…,x_n) при условии , что являются x₁,x₂,…,x_m функциями переменных x_m+1,…,x_n определяемых уравнениями связи (6.3) в некоторой окрестности точки x⁽⁰⁾.Будем дополнительно предполагать , что f₀(x ) и f_i(x ) ,i=1,2,…,m дважды непрерывно дифференцируема в точке x⁽⁰⁾.

Выше отмечалось (в пункте 6.2) , что x⁽⁰⁾ является точкой условного (строгого) экстремума для функции f₀(x) относительно уравнений связи (6.3) тогда и только тогда , когда x⁽⁰⁾ является точкой обычного (строгого) экстремума для функции g(x).Поэтому , если например , в точке x⁽⁰⁾ функция g(x) удовлетворяет достаточным условиям существования строгого экстремума,то в этой точке функция f₀(x) имеет условный строгий экстремум относительно уравнений связи (6.3).Достаточные условия для обычного сторого экстремума были получены нами ранее .Для нашего случая они имееют вид :

1) g(x⁽⁰⁾)

x_i i=m+1,…,n; (6.33)

2)второй дифферециал

²g(x⁽⁰⁾ )

d²g(x⁽⁰⁾ )= -----------dx_idx_j (6.34)

x_i x_j

является положительно или отрицательно определенной квадратичной формой.

При выполнении этих условий x⁽⁰⁾ является точкой строгого минимума или максимума для функции g(x).В силу сказанного выше указанные условия являются и достаточными условиями для того, чтобы x⁽⁰⁾ являлось точкой условного строго минимума (максимума) для функции f₀(x) относительно уравнений связи (6.3). Однако они неудобны для практического использования , так как требуют знания функции g(x).Поэтому , исходя из полученных достаточных условий условного строгого экстремума , выраженных посредством функции g(x) , получим достаточные условия того же экстремума , но выраженные только через функцию Лагранжа и уоавнений связи.

Прежде всего заметим , что в силу условия (6.4) система (6.29) разрешима, и притом однозначно, относительно dx₁,…,dx_m при произвольно фиксированных dx_m+1,…,dx_n .Систему (6.29), выражающую равенство нулю дифференциалов функции f_i(x) в точке x⁽⁰⁾:

d f_i(x)=0, i=1,2,…,m

при выполнении условий (6.3) , будем записывать кратко в виде :

df=0 (6.35)

где

f=(f₁,f₂,…,f_m)

Пусть x⁽⁰⁾ является стационарной точкой для функции Лагранжа F(x).Это означает, что dF(x⁽⁰⁾)=0, т.е. что в этой точке f₀+ _if_i=0.В теореме 2 показано, что в том случае x⁽⁰⁾ является стационарной точкой для функции, т.е.

dg(x⁽⁰⁾)=0 (6.36)

Поясним еще раз вывод этой формулы и покажем, что

d²g(x⁽⁰⁾ )= d²F(x⁽⁰⁾ ) _df=0 (6.37)

Это равенство следует понимать как равенство функции n-m переменных dx_m+1,…,dx_n.В правой части равенства (6.37) остальные переменные dx₁,…,dx_m, которые входят в выражения написанных дифференциалов, определяются из системы уравнений (6.35) или, что равносильно (см. формулы (6.5))

dx_k=d _k(x₁,x₂,…,x_n-m), k=1,2,…,m

Используя инвариантность формы первого дифференциала относительно выбора переменных и формулу (6.6), имеем

f₀ (x⁽⁰⁾ )

dg(x⁽⁰⁾ )= -----------dx_j

x_j

Прибавим к этому равенству сумму (равную нулю) левых частей тождеств (6.29), умноженных соответственно на постоянные _i, входящие в функцию Лагранжа F(x) (точнее, i-е равенство (6.29) умножается на постоянную _i).Тогда, использовав условие (6.11), получим

F(x⁽⁰⁾)

dg(x⁽⁰⁾ )= -------[f₀ (x )+ _if_i (x)] dx_j= --------- dx_j=0

x_j x=x₀x_j

Утверждение (6.36) доказано.

Равенство (6.37) доказывается аналогичным приемом.Прежде всего напишем второй дифференциал для функции g(x) в точке x⁽⁰⁾:

²f₀(x⁽⁰⁾ ) f₀(x⁽⁰⁾ )

d²g(x⁽⁰⁾ )= -----------dx_jdx_k + ----------- d²x_j (6.38)

x_j x_k x_j

Далее продифференцировав тождества, получающиеся в результате дифференцирования уравнений связи (6.3), т.е. тождества будем иметь в точке x⁽⁰⁾ :

²f₀(x⁽⁰⁾ ) f₀(x⁽⁰⁾ )

d²g(x⁽⁰⁾ )= -----------dx_jdx_k + ----------- d²x_j =0 (6.39)

x_j x_k x_j

i=1,2,…,n

Умножив i–е равенство (6.39) на постоянную _i, входящую в функцию Лагранжа F(x), прибавим получившееся выражение к правой части равенства (6.38) ; тогда получим

²F(x⁽⁰⁾ ) F(x⁽⁰⁾ )

d²g(x⁽⁰⁾ )= -----------dx_jdx_k + ----------- d²x_j (6.38)

x_j x_k x_j

где dx_i, i=1,2,…,n удовлетворяет системе уравнений (6.35).Поскольку x⁽⁰⁾ точка стационарная для функции Лагранжа, то второй член получившегося равенства обращается в нуль, и тем самым формула (6.37) доказана.

Будем говорить, что квадратичная форма d²F(x⁽⁰⁾ ) является положительно (отрицательно) определенной квадратичной формой переменных dx_i, i=1,2,…,n, при условии, что эти переменные удовлетворяют системе уравнений (6.35), если для любых dx_i, i=1,2,…,n , удовлетворяющих этой системе уравнений и таких, что (dx_i)²>0 выполняется неравенство d²F(x⁽⁰⁾ ) >0 (соответственно d²F(x⁽⁰⁾ ) <0)

Пусть точка x⁽⁰⁾ удовлетворяет уравнениям связи (6.3) и является стационарной для функции Лагранжа (6.11) и пусть второй дифференциал функции Лагранжа в этой точке является положительно (отрицательно) определенной квадратичной формой переменных dx₁,…,dx_n, при условии, что они удовлетворяют системе уравнений (6.35).Тогда из (6.36) и (6.37) следует, что x⁽⁰⁾ является стационарной точкой для функции g(x) и что второй дифференциал этой функции в точке x⁽⁰⁾ является положительно (отрицательно) определенной квадратичной формой переменных dx_m+1,…,dx_n, и, следовательно, функция имеет в точке x⁽⁰⁾ строгий минимум (максимум) , а значит, функция f₀(x) имеет в точке x⁽⁰⁾ условный строгий минимум (максимум) относительно уравнений связи (6.3).

Сформулируем полученный результат в виде теоремы.

Теорема 6.3: Если x⁽⁰⁾ удовлетворяет уравнениям связи (6.3) и является стационарной точкой для функции Лагранжа (6.11) и если второй дифференциал функции Лагранжа в этой точке является положительно (отрицательно) определенной квадратичной формой переменных dx₁,…,dx_n при условии, что они удовлетворяют системе уравнений (6.29), то x⁽⁰⁾ является точкой строгого минимума (максимума) для функции f относительно уравнений связи (6.3).

Таким образом, чтобы исследовать стационарную точку функции Лагранжа (6.11) на условный экстремум, надо исследовать на определенность квадратичную форму (6.37), т.е. второй дифференциал функции Лагранжа в этой точке при выполнении условий связи (6.3) (когда дифференциалы dx_i, i=1,2,…,n связаны соотношениями (6.29)).При этом следует иметь в виду, что если второй дифференциал функции Лагранжа в рассматриваемой точке окажнтся положительно (отрицательно) определенным и без выполнения условий связи, то он будет и таковым , конечно, и при их выплнении.

7.Заключение.

Математический анализ это совершенно естественная, простая и элементарная наука, ничуть не более заумная, сложная или “высшая”, чем, скажем, “элементарная” геометрия. Многие теоремы, традиционно входившие в курс геометрии, куда сложнее, чем основополагающие теоремы классического анализа. Ныне противопоставление элементарной математики и анализа непродуктивно, и вовсе необязательно проявлять бездну остроумия только лишь из боязни использовать свойства производной.

Привнесение элементов математического анализа в школьные программы неизбежно приведет к перестройке и других областей математического образования – изменится содержание конкурсных задач, кружковой работы, математических олимпиад и многого другого. Теперь уже невозможно не учитывввать, что школьник должен знать нечто из ранее недоступной ему высшей математики.

При этом следует иметь в виду, что если освоены лишь самые основы математического анализа, можно уже делать попытки подобраться ко многим современным проблемам.

При рассмотрении данной темы дипломного проекта теоритические сведения подтвердились практическим доказательством и математическим обоснованием.

8. Библиография.

1.А.Ф.Бермант, И.Г.Араманович Краткий курс математического анализа.-М.: Наука, 1973.

2.И.Е.Жак Дифференциальное исчисление.-М.:Государственное учебно-педагогическое издательство министерства просвещения РСФСР, 1960.

3.Г.И.Запорожец Руководство к решению задач по математическому анализу.-М.: Высшая школа,1966.

4.В.А.Зорич Математический анализ.-М.: Наука, 1981.

5.А.П.Картышев, Б.Л.Рождественский Математический анализ.-М.: Наука, 1984.

6.А.Н.Колмогоров, С.В.Фомин Элементы теории функций и функционального анализа.-М.: Наука, 1981.

7.Л.Д.Кудрявцев Курс математического анализа.-М.: Высшая школа, 1981.

8.А.Г.Моркович, А.С.Солодовников Математический анализ.-М.: Высшая школа, 1990.

9.Н.С.Пискунов Дифференциальное и интегральное исчисление. т.1.-М.: Наука, 1978.

10.К.А.Рыбников История математики.-М.:Издательство Московского университета, 1994.

11.В.М.Тихомиров Рассказы о максимумах и минимумах.-М.:Наука, 1986.

12.Г.М.Фихтенгольц Основы математического анализа. т.2.-М.: Наука, 1968.

13.Г.М.Фихтенгольц Курс дифференциального и интегрального исчисления. т.1.-М.: Наука, 1969.