Содержание

Введение..................................................................................................... 3

1. Экстремумы функций одной переменной............................................. 4

1.1. Необходимое условие..................................................................... 4

1.2. Достаточное условие. Первый признак......................................... 5

1.3. Достаточное условие. Второй признак.......................................... 7

1.4. Использование высших производных........................................... 9

2. Экстремумы функций трех переменных............................................. 10

2.1. Необходимые условия экстремума.............................................. 10

2.2. Достаточное условие экстремума................................................ 11

3. Экстремумы функций многих переменных........................................ 16

3.1.Необходимые условия экстремума............................................... 16

5.2. Достаточные условия экстремума................................................ 19

4. Условный экстремум........................................................................... 22

4.1. Постановка вопроса...................................................................... 22

4.2. Понятие условного экстремума................................................... 23

Заключение.............................................................................................. 26

Библиография.......................................................................................... 27

Введение

Цель данной работы – рассмотрение и описание функций одной и многих переменных, а также в рассмотрении методов, используемых при этом.

В жизни постоянно приходится сталкиваться с необходимостью принять наилучшее возможное (иногда говорят - оптимальное) решение. Огромное число подобных проблем возникает в экономике и технике. При этом часто случается так, что полезно прибегнуть к математике.

В математике исследование задач на максимум и минимум началось очень давно – двадцать пять веков назад, Долгое время к задачам на отыскание экстремумов не было сколько – нибудь единых подходов. Но примерно триста лет назад – в эпоху формирования математического анализа – были созданы первые общие методы решения и исследования задач на экстремум.

Накопление методов дифференциального исчисления приняло наиболее явную форму у Ферма. В 1638 году он сообщил в письме Декарту, что решил задачу определения экстремальных значений функции f(x). Ферма составлял уравнение (f(x+h)-f(x))/h=0 и после преобразований в левой части полагал h=0, вопреки мнению позднейших исследователей, которые видели в этой идеи исчисления бесконечно малых. В действительности, Ферма нашел это условие и аналогичное (f(y)-f(x))/(y-x)=0 при y=x ещё алгебраическими путями.

Рассуждения при нахождении экстремума функции f(x) следующие. Пусть для некоторого x функция достигает максимума. Тогда f(x h)<f(x);f(x) Ph Qh2 …<f(x) . Вычитаем из обеих частей и делим на h, откуда  P Qh …<0.Так как h можно выбрать любой малости, член P будет по модулю больше суммы всех остальных членов. Неравенство поэтому возможно лишь при условии P=0, что и дает условие Ферма. В случае минимума рассуждения аналогичные. Ферма знал также, что знак Q определяет характер экстремума.

1. Экстремумы функций одной переменной

1.1. Необходимое условие

Пусть функция f(x), определенная и непрерывная в промежутке [a,b], не является в нем монотонной. Найдутся такие части промежутка [a,b], в которых наибольшее и наименьшее значение достигается функцией во внутренней точке.

Говорят, что функция f(x) имеет в точке максимум (или минимум), если эту точку можно окружить такой окрестностью (x0-  ,x0+  ), содержащейся в промежутке, где задана функция, что для всех её точек выполняется неравенство.

f(x) < f(x0)(или f(x)>f(x0))

Иными словами, точка x0 доставляет функции f(x) максимум (минимум), если значение f(x0) оказывается наибольшим (наименьшим) из значений, принимаемых функцией в некоторой (хотя бы малой) окрестности этой точки. Отметим, что самое определение максимума (минимума) предполагает, что функция задана по обе стороны от точки x0.

Если существует такая окрестность, в пределах которой (при x=x0) выполняется строгое неравенство

f(x)<f(x0) (или f(x)>f(x0)

то говорят, что функция имеет в точке x0 собственный максимум (минимум), в противном случае – несобственный[1].

Если функция имеет максимумы в точках x0 и x1 , то, применяя к промежутку [x0,x1] вторую теорему Вейерштрасса, видим, что наименьшего своего значения в этом промежутке функция достигает в некоторой точке x2 между x0 и x1  и имеет там минимум. Аналогично, между двумя минимумами непременно найдется максимум. В том простейшем (и на практике – важнейшим) случае, когда функция имеет вообще лишь конечное число максимумов и минимумов, они просто чередуются.

Заметим, что для обозначения максимума или минимума существует и объединяющий их термин – экстремум.

Понятия максимум (max f(x)) и минимум (min f(x)) являются локальными свойствами функции и имеют место в определенной точке х0. Понятия наибольшего (sup f(x)) и наименьшего (inf f(x)) значений относятся к конечному отрезку [a,b] и являются глобальными свойствами функции на отрезке.

Поставим задачу о разыскании всех значений аргумента,  доставляющих функции экстремум. При решении ее основную роль будет играть производная.

Предположим сначала, что для функции f(x) в промежутке(a,b) существует конечная производная. Если в точке х0 функция имеет экстремум, то, применяя к промежутку          (х0-     ,х0+  ), о которой была речь выше, теорему Ферма, заключаем, что f (x)=0 этом состоит необходимое условие экстремума. Экстремум следует искать только в тех точках, где производная равна нулю.

С геометрической точки зрения это означает, что касательная к графику функции в его вершине или впадине параллельна оси ОХ.

Не следует, думать, однако, что каждая точка, в которой производная равна нулю, доставляет функции экстремум: указанное только что необходимое условие не является достаточным.

1.2. Достаточное условие. Первый признак

Дополним, что точки, где производная равна нулю, называются стационарными; а точки, где производная не существует называются критическими.

Итак, если точка х0 есть стационарная точка для функции f(x) или если в этой точке не существует для неё двусторонней конечной производной, то точка х0 представляется, так сказать лишь “подозрительной” по экстремуму и подлежит дальнейшему испытанию.

Это испытание состоит а проверке достаточных условий для существования экстремума, которые мы сейчас установим.

Предположим, что в некоторой окрестности (х-  ,х+  ) точки х0 (по крайней мере, для х=х0) существует конечная производная и как слева от х0 , так и справа от х0 (в отдельности) сохраняет определенный знак. Тогда возможны следующие три случая:

I f’(x)>0 при х<х0 и f’(x)<0 при х>х0, т. е. производная f’(x) при переходе через точку х0 меняет знак плюс на минус. В этом случае, в промежутке [х0- ,х0] функция f(x) возрастает, a в промежутке [х00+ ] убывает, так что значение f(x) будет наибольшим в промежутке [х0- ,х0+ ] , т. е. в точке х0 функция имеет собственный максимум.

II f’(x)<0 при х<х0 и f’(x)>0 при х>х0 , т. е. производная f’(x) при переходе через точку х0 меняет знак минус на плюс. В этом случае аналогично убеждаемся, что в точке х0 функция имеет собственный минимум.

III f’(x)>0 как при х<х0 так и при х>х0 либо же f’(x) и слева и справа от х0, т. е. при переходе через х0 , не меняет знака. Тогда функция либо всё время возрастает, либо всё время убывает; в любой близости от х0 с одной стороны найдутся точки х, в которых f(x)<f(x0), а с другой – точки х, в которых f(x)>f(x0) так что в точке х0 никакого экстремума нет[2].

Итак, мы получаем правило для испытания “подозрительного” значения х0 : подставляя в производную f’(x) сначала х<х0 , а затем х>х0, устанавливаем знак производной вблизи от точки х0 слева и справа от неё; если при этом производная f’(x) меняет знак плюс на минус , то налицо максимум, если меняет знак с минуса на плюс, то – минимум ; если же знака не меняет, то экстремума вовсе нет.

Это правило полностью решает вопрос в том случае, когда в промежутке (а,b), как это обычно бывает, всего лишь конечное число стационарных точек или точек, где отсутствует конечная производная:

a<х12<… <хkk+1<… <хn<b                                            (1.1)

именно, тогда прежде всего, в любом промежутке (а,х1), (х12), … ,(хkk+1), … ,(хn,b) существует конечная производная f’(x) и, кроме того, в каждом таком промежутке f’(x) сохраняет постоянный знак. Действительно, если бы f’(x) меняла знак, например, в промежутке (хkk+1) , то по теореме Дарбу, она обращалась бы в нуль в некоторой точке между хk и хk+1, что невозможно, поскольку все корни производной уже содержатся в ряду точек (1.1).

Последнее замечание бывает полезно в некоторых случаях на практике: знак производной f’(x) во всем промежутке (хkk+1) определяется , если вычислить значение (или даже только установить знак) её в одной какой-либо точке этого промежутка.

1.3. Достаточное условие. Второй признак

Нередко более удобным на практике оказывается другой признак существования экстремума, основанный на выяснении знака второй производной в стационарной точке.

Справедлива следующая теорема.

Теорема. Если х0 есть стационарная точка функции f(x) и f’’(x)<0, то в точке х0 функция имеет максимум, а если f’’(x)>0 , то функция имеет в точке х0 минимум[3].

Доказательство: По определению второй производной

                    (f’(x)-f’(x0)

f’’(x0)=lim-------------

                    x-x0

По условию теоремы f’(x)=0. Поэтому

            f’(x)

f’’=lim----------

              x-x0

Допустим, что f’’(x)<0. Тогда по теореме о пределах функции найдётся такой интервал (x0-,x0+), в котором переменная величина f’(x)/(x-x0) сохраняет знак своего предела, т. е. выполняется неравенство           

                 f’(x)

            ----------<0      (x0-  <x<x0+   )

               x-x0

Отсюда следует, что f’(x)>0 , если х-х0<0, или х>х0, и f’(x)<0, если х-х0>0, или х>х0. На основании первого достаточного признака существования экстремума заключаем, что в точке х0 функция f(x) имеет максимум. Аналогично показывается, что условие f’’(x)>0 обеспечивает минимум функции f(x).

                                                 ч.т.д.

Таким образом получаем правило нахождения экстремумов (для дважды дифференцируемых функций):

1.Вычисляем первую производную f’(x) и из уравнения  f’(x)=0 находим стационарные точки функции f(x).

2.Вычсляем вторую производную, и каждую стационарную точку х0 подвергаем испытанию:                                          

если f’’(x)>0, то х0 – точка минимума функции;

если f’’(x)<0, то х0 – точка максимума функции.

Замечание 1: если f’’(x)=0 ,то это правило теряет силу и нужно воспользоваться первым признаком нахождения экстремумов. При этом экстремум может существовать , а может и не существовать.(Например, как для функции y=x3,так и для функции y=x4, вторая производная обращается в нуль в точке х=0, но первая из них не имеет экстремумов в точке х=0, а вторая имеет в ней минимум).

Однако в случае своей применимости второй признак оказывается весьма удобным: вместо рассмотрения знака функции f’(x) в точках, отличных от предполагаемой точки экстремума, он позволяет дать ответ по знаку функции f’’(x) в той же точке.

1.4. Использование высших производных

В случае, когда f’’(x)=0 (f’(x)=0) экстремум может быть, а может и не быть. Рассмотрим общий случай.

Теорема. Пусть функция f:U(x0) R, определенная в окрестности U(x0) точки х0, имеем в х0 производные до порядка n включительно  (n>1).

Если f’(x0)=…=f (n-1)(x0)=0 и f(n)(x0)=0 , то при n нечетном в х0 экстремума нет, а при n четном экстремум есть, причем это строгий локальный минимум, если f(n)(x0)>0 , и строгий локальный максимум, если f (n)(x0).

Доказательство: Используя локальную формулу Тейлора[4]

f(x)-f(x0)=f(n)(x0)(x-x0)n+   (x)(x-x0)n                                          (1.2)

где  (x) 0 при x  x0,будем рассуждать так же, как при доказательстве леммы Ферма. Перепишем (1.2) в виде

f(x)-f(x0)=(f(n)(x0)+   (x))(x-x0)n                                                   (1.3)

Поскольку f(n)(x0)=0,а  (x)  0 при  x  x0, сумма имеет знак fn(x0),когда х достаточно близок к х0. Если n нечетно, то при переходе через х0 скобка (х-х0)n меняет знак и тогда изменяется знак всей правой , а следовательно, и левой части равенства (1.3). Значит, при n=2k+1 экстремума нет.

Если n четно, то (x-x0)n>0 при x=x0 и, следовательно, а малой окрестности точки х0 знак разности f(x)-f(x0), как видно из равенства (1.3), совпадает со знаком f(n)(x0) :

пусть f(n)(x0),тогда в окрестности точки х0 f(x)>f(x0), т. е. в точке х0 – локальный минимум;

пусть f(n)(x0)>0,тогда f(x)>f(x0) ,т. е. в точке х0 локальный минимум.                                                                  ч.т.д.  

2. Экстремумы функций трех переменных.

2.1. Необходимые условия экстремума

Пусть функция v=f(x,y,z) определена в области D и (x0,y0,z0) будет внутренней точкой этой области.

 Говорят, что функция v=f(x,y,z) в точке (x0,y0,z0)  имеет максимум (минимум), если её можно окружить такой окрестностью

(x0-   ,x0+  , y0-  ,y0+  ,z0-  ,z0+   )

что бы для всех точек этой окрестности выполнялось неравенство

f(x,y,z)<f(x0,y0,z0)

                                                          (>)

Если эту окрестность взять настолько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме  самой   точки (x0,y0,z0) выполнялось строгое неравенство

                                     f(x,y,z)<f(x0,y0,z0)

                                               (>)

то говорят, что в точке (x0,y0,z0)  имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным.

Для обозначения максимума и минимума (как и в случае одной переменной) употребляется общий термин – экстремум.

Предположим, что наша функция в некоторой точке (x0,y0,z0)  имеет экстремум,

Покажем, что если в этой точке существуют (конечные) частные производные

fx’(x0,y0,z0), fy’(x0,y0,z0) ,fz’(x0,y0,z0)

то все эти частные производные равны нулю, так что обращение в нуль частных производных первого порядка является необходимым условием существования экстремума.

С этой целью положим y= y0,z= z0 сохраняя х переменным ; тогда у нас получится функция от одной переменной х :

v=f(x, y0,z0)

Так как мы предположили, что в точке (x0,y0,z0)  существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности (x0-, x0+  ) точки x=x0, необходимо должно выполняться неравенство

f(x, y0,z0)<f(x0,y0,z0)

так что упомянутая выше функция одной переменной в точке будет иметь максимум, а отсюда по теореме Ферма[5] следует, что

fx’(x0,y0,z0)=0

Таким образом можно показать, что в точке и остальные частные производные равны нулю.

Итак, «подозрительными» на экстремум являются те точки, в которых частные производные первого порядка все обращаются в нуль: их координаты можно найти, решив систему уравнений

fx’(x,y,z)=0

fy’(x,y,z)=0                                                                                      (2.2)

fz’(x,y,z)=0

Как и в случае функции одной переменной, подобные точки называются стационарными.

2.2. Достаточное условие экстремума

Как и в случае  функции одной переменной, в стационарной точке вовсе не обеспечено наличие экстремума. Таким образом, встает вопрос об достаточных для существования (или отсутствия) экстремума в стационарной точке, то есть о том исследовании, которому эта точка должна быть дополнительно подвергнута.

Предположим, что функция v=f(x,y,z) определена, непрерывна и имеет непрерывные частные производные первого и второго порядков в окрестности некоторой точки (x0,y0,z0), которая является стационарной, т.е. удовлетворяет условиям

 fx’(x0,y0,z0)=0,fy’(x0,y0,z0)=0 ,fz’(x0,y0,z0)=0

Чтобы установить, действительно ли наша функция имеет в точке (x0,y0,z0) экстремум или нет, естественно обратимся к рассмотрению разности

= f(x,y,z)- f(x0,y0,z0)

Разложим ее по формуле Тейлора,

=   { fx ’’ x12+fx ’’ x22+…+fx ’’ xn2+2fx1x2 ’’ x1 x2+ +2fx1x3 ’’ xx3+…+2fxn-1xn ’’ xn-1  xn}=     fxixj ’’ xi   xj

где   x= xi-xi0 ; производные все вычислены в некоторой точке

(x10+0 x1, x20+0 x2,…, xn0+0 xn)    (0<0<1)

Введём и здесь значения

fxixj ’’ (x10,x20,…,xn0)=aik     (i,k=1,2,…,n)                                        (2.3)

так что

fxixj ’’ (x10+0 x1, x20+0 x2,…, xn0+0 xn)= aik+   ik

и

           ik    0    при   x1   0,…, xn   0                                                            (2.4)

Теперь интересующее нас выражение можно написать в виде:

=   {     aik  xi   xk+         ik  xi   xk}                                                               (2.5)

На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке: он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных   x1,…,  xn. От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса.

В высшей алгебре квадратичную форму[6]

                                 aik  yi  yk         (aik = aki)                                     (2.6)

от переменных y1,…,yn называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю.

Необходимое и достаточное условие для того, чтобы форма (2.6) была определенной и положительной принадлежит Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:

                 a11 a12                  a11 a12 a13                          

a11>0,       a21 a22       ,    a21 a22 a23    >0,     

                                       a31 a32 a33                       

Так как определенная отрицательная форма с изменением знака всех её членов переходит в определенно положительную, и обратно, то отсюда легко найти и характеристику отрицательной формы: она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого).

            a11 a12                                           a11 a12 a13                         

a11>0,   a21 a22                 a21 a22 a23    >0

                                      a31 a32 a33                                                 

 Следовательно, чтобы исследовать точку М(x0,y0,z0) на экстремум , надо исследовать квадратичную форму (2.6).

Сформулируем полученный результат в виде теоремы.

Теорема : Пусть в некоторой области, содержащей точку М(x0,y0,z0), функция f(x,y,z) имеет непрерывные частные производные до второго порядка включительно; пусть  кроме того, точка М(x0,y0,z0) является критической точкой функции f(x,y,z), т.е.                                          

    f(x0,y0,z0)           f(x0,y0,z0)           f(x0,y0,z0)

--------------- =0, ---------------=0, ---------------=0

          x                          y                      z

Тогда при x=x0,y=y0,z=z0 :

f(x,y,z) имеет максимум , если

    2 f(x0,y0,z0)          2 f(x0,y0,z0)    2 f(x0,y0,z0)      2 f(x0,y0,z0) 2

---------------<0 , -------------------------------- -  --------------- >0  

         x2                         x2        y2                                               x       y

2 f(x0,y0,z0)       2 f(x0,y0,z0)    2 f(x0,y0,z0)      2 f(x0,y0,z0) 2

---------------   -------------------------------- -  ---------------   --     

         x2                    x2        z2                                               y   z

 

           2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   --  ---------------      -------------------------------- --

                  x  y                  x    y                      z2

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--  ---------------------------------    +

              x   z               y    z   

               2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   +   ---------------      -------------------------------- --

                x    z                    x        y         y   z

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--      ------------------------------- >0

                x   z               y2

      

f(x,y,z) имеет минимум, если

2 f(x0,y0,z0)          2 f(x0,y0,z0)    2 f(x0,y0,z0)      2 f(x0,y0,z0) 2

--------------->0 , -------------------------------- -  --------------- >0  

         x2                         x2        y2                                               x       y

2 f(x0,y0,z0)       2 f(x0,y0,z0)    2 f(x0,y0,z0)      2 f(x0,y0,z0) 2

---------------   -------------------------------- -  ---------------   --     

         x2                    x2        z2                                               y   z

 

         2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   --  ---------------      -------------------------------- --

              x  y                  x    y                      z2

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--  ---------------------------------    +

               x   z               y    z   

            2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   +   ---------------      -------------------------------- --

                x    z                    x        y         y   z

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--      ------------------------------- >0

                              x   z               y2

    

3) если

2 f(x0,y0,z0)       2 f(x0,y0,z0)    2 f(x0,y0,z0)      2 f(x0,y0,z0) 2

---------------   -------------------------------- -  ---------------   --     

         x2                    x2        z2                                               y   z

            2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   --  ---------------      -------------------------------- --

                  x  y                  x    y                      z2

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--  ---------------------------------    +

                       x   z               y    z   

              2 f(x0,y0,z0)        2 f(x0,y0,z0)    2 f(x0,y0,z0)

   +   ---------------      -------------------------------- --

             x    z                    x        y         y   z

               2 f(x0,y0,z0)     2 f(x0,y0,z0)

--      ------------------------------- =0

             x   z               y2

то экстремум может быть, а может и не быть (в этом случае требуется дальнейшее исследование)

4) во всех остальных случаях f(x,y,z) не имеет ни максимума, ни минимума. 

3. Экстремумы функций многих переменных

3.1.Необходимые условия экстремума.

Пусть функция u=f(x1,x2,…,xn) определена в области D и (x10,x20,…,xn0) будет внутренней точкой этой области.

Говорят, что функция u=f(x1,x2,…,xn)  в точке (x10,x20,…,xn0) имеет максимум (минимум), если её можно окружить такой окрестностью

(x10         x10       x20        x20              xn0       xn0        )

что бы для всех точек этой окрестности выполнялось неравенство[7]

f(x1,x2,…,xn)<f(x10,x20,…,xn0)

                                                        (>)

Если эту окрестность взять настолько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме  самой   точки (x10,x20,…,xn0) выполнялось строгое неравенство

                              f(x1,x2,…,xn)<f(x10,x20,…,xn0)

                                                 (>)

то говорят, что в точке (x10,x20,…,xn0) имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным.

Для обозначения максимума и минимума (как и в случае одной переменной) употребляется общий термин – экстремум.

Предположим, что наша функция в некоторой точке (x10,x20,…,xn0)  имеет экстремум,

Покажем, что если в этой точке существуют (конечные) частные производные

fx1’(x10,x20,…,xn0) ,…, f ’xn(x10,x20,…,xn0)

то все эти частные производные равны нулю, так что обращение в нуль частных производных первого порядка является необходимым условием существования экстремума.

С этой целью положим x2=x20,…,xn= xn0 сохраняя x1  переменным; тогда у нас получится функция от одной переменной x1:

u=f(x1, x20,…,xn0)

Так как мы предположили, что в точке (x10,x20,…,xn0) существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности(x10-  , x10+) точки x1= x10, необходимо должно выполняться неравенство

f(x1, x20,…,xn0)< f(x10,x20,…,xn0)

так что упомянутая выше функция одной переменной в точке x1= =x10 будет иметь максимум, а отсюда по теореме Ферма следует, что

fx1’(x10,x20,…,xn0)=0

Таким образом можно показать, что в точке (x10,x20,…,xn0) и остальные частные производные равны нулю.

Итак, «подозрительными» на экстремум являются те точки, в которых частные производные первого порядка все обращаются в нуль: их координаты можно найти, решив систему уравнений[8]

fx1’(x10,x20,…,xn0)=0

                           …………………….                                    (3.1)

f ’xn(x10,x20,…,xn0)=0

Как и в случае функции одной переменной, подобные точки называются стационарными.

Замечания: Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать так:

d f(x1,x2,…,xn)=0

так как, если fx1’= fx2’=…= f ’xn , то каковы бы ни были dx1,dx2,…,dxn всегда

f(x1,x2 d,…,xn)= fx1’ dx1+ fx2’ dx2+…+ f ’xn dxn=0

И обратно: если в данной точке тождественно выполняется это условие, то ввиду произвольности dx1,dx2,…,dxn производные fx1’, fx2’,…, f ’xn  порознь равны нулю.

Обычно, рассматриваемая функция f(x1,x2,…,xn) имеет (конечные) частные производные во всей области, и тогда точки, доставляющие функции экстремумы, следует искать лишь среди стационарных точек. Однако встречаются случаи, когда в отдельных точках некоторые частные производные имеют бесконечные значения или вовсе не существуют (в то время как остальные равны нулю). Подобные точки, собственно, тоже следует причислить к «подозрительным» по экстремуму, наряду со стационарными.

Иногда дается и не прибегая к достаточным условиям выяснить характер стационарной точки функции. Так, если из условия задачи непременно следует, что рассматриваемая функция имеет где-то максимум или минимум и при этом системе уравнений (3.1) удовлетворяет только одна точка, то ясно, что эта точка и будет искомой точкой экстремума функции.

Заметим, наконец, что точками экстремума непрерывной функции могут быть точки, в которых функция недифференцируема (им соответствующая, например, острия поверхности – графика функции).

5.2. Достаточные условия экстремума

Так же как и для функции одной переменной, необходимый признак экстремума в случае многих переменных не является достаточным. Это значит, что из равенства нулю частных производных в данной точке вовсе не следует, что эта точка обязательно является точкой экстремума.

Достаточные условия экстремума для функций нескольких переменных носит значительно более сложный характер, чем для функции одной переменной[9].

Пусть функция f(x1,x2,…,xn) определена, непрерывна и имеет непрерывные производные первого и второго порядков окрестности некоторой стационарной точки (x10,x20,…,xn0). Разлагая разность

= f(x1,x2,…,xn)-f(x10,x20,…,xn0)

по формуле Тейлора, получим

=   { fx ’’ x12+fx ’’ x22+…+fx ’’ xn2+2fx1x2 ’’ x1 x2+ +2fx1x3 ’’ xx3+…+2fxn-1xn ’’ xn-1  xn}=     fxixj ’’ xi   xj

где   x= xi-xi0 ; производные все вычислены в некоторой точке

(x10+0 x1, x20+0 x2,…, xn0+0 xn)    (0<0<1)

Введём и здесь значения

fxixj ’’ (x10,x20,…,xn0)=aik     (i,k=1,2,…,n)                              (3.2)

так что

fxixj ’’ (x10+0 x1, x20+0 x2,…, xn0+0 xn)= aik+   ik

и

                ik    0    при   x1   0,…, xn   0                                    (3.3)

Теперь интересующее нас выражение можно написать в виде:

        =   {     aik  xi   xk+         ik  xi   xk}                                    (3.4)

На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке: он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных   x1,…,  xn. От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса.

В высшей алгебре квадратичную форму

               aik  yi  yk         (aik = aki)                                             (3.5)

от переменных y1,…,yn называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю.

Необходимое и достаточное условие для того, чтобы форма (3.5) была определенной и положительной принадлежит ,как было уже сказано выше , Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:

                  a11 a12                  a11 a12 a13                          a11 a12… a1n

a11>0,       a21 a22       ,    a21 a22 a23    >0,…,    a21 a22… a2n

                                      a31 a32 a33                          …………………

                                                                           an1 an2… ann

Так как определенная отрицательная форма с изменением знака всех её членов переходит в определенно положительную, и обратно, то отсюда легко найти и характеристику отрицательной формы: она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого).

Пользуясь этими понятиями. Сформулируем достаточные для существования экстремума условия:

Если второй дифференциал, т. е. квадратичная форма

aik  xi   xk                                                                                                        (3.6)

со значениями (3.2) коэффициентов – оказывается определенной положительной (отрицательной) формой, то в используемой точке (x10,x20,…, xn0)   будет собственный минимум (максимум).

Для доказательства введем расстояние

=    x12+…+ xn2

между точками (x10,x20,…,xn0) и (x1,x2,…,xn). Вынося в (3.5) за скобку     и полагая

xi       (i=1,2,…,n)

перепишем выражение для    в виде

                =    {   aik  Ei Ek+        ik Ei  Ek}                                          (3.7)

Числа  Ei  зараз не обращаются в нуль, поэтому, если форма (3.7) – положительная, первая сумма в скобках в формуле (3.7) иммет всегда положительный знак. Больше того, так как

                                    Ei=1                                                   (3.8)

то найдется такое постоянное положительное число m, что при всех возможных значениях Ei будет

aik  Ei Ek>m

Действительно, эта сумма представляет собой непрерывную функцию от аргументов Ei во всем пространстве, в частности же и в множестве М тех точек(E1,…, En), которые удовлетворяют соотношению (3.8) («сферическая поверхность»). Но множество это, как нетрудно видеть, замкнуто, т. е. содержит все свои точки сгущения; а тогда, по теореме Вейерштрасса, названная сумма будет иметь в М наименьшее значение, необходимо положительное (как и все ее значения в М).

С другой стороны, ввиду (3.3) вторая сумма в (3.7) для достаточно малых, очевидно, будет по абсолютной величине уже меньше m, так что вся скобка окажется положительной. Итак, в достаточно малой сфере, с центром в точке (x10,x20,…,xn0) разность    будет положительна, откуда и явствует, что в названной точке функция f(x1,x2,…,xn) имеет собственный минимум.

Аналогично исчерпывается и случай, когда форма (3.6) будет определенной, но отрицательной.

Для того, чтобы квадратичная форма (3.6) была отрицательно определенной, необходимо и достаточно, чтобы

                 a11 a12                  a11 a12 a13                                 a11 a12… a1n

a11<0,       a21 a22       ,    a21 a22 a23    <0,…,(-1)n  a21 a22… a2n      

                                       a31 a32 a33                                   …………………

                                                                                                                     an1 an2… ann

4. Условный экстремум

4.1. Постановка вопроса

Одним из наиболее ярких популярных достижений дифференциального исчисления являются предполагаемые им рецепты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось к внутренним экстремумам.

Иными словами, эти результаты применимы только к исследованию  поведения  функции Rn x f(x) R в          окрестности точки тогда, когда аргумент может принимать любое значение из некоторой окрестности Rn в точки x0.

Часто возникает более сложная и с практической точки зрения даже более интересная ситуация, когда ищется экстремум функции при некоторых условиях, ограничивающих область измерения аргумента. Типичным примером может служить изопериметрическая задача, когда ищется тело, имеющее максимальный объем при условии, что ограничивающая его поверхность имеет заданную площадь. Чтобы получить доступную нам математичкою запись такой задачи, упростим постановку и будем считать, что задача состоит в том, чтобы среди прямоугольников, имеющих заданный периметр 2р, найти тот, который имеет наибольшую площадь. Обозначив через х и у длины сторон прямоугольника, запишем, что

       (х,у)=х-у

        х+у=р

Итак, надо найти экстремум функции    (х,у) при условии, что переменные х,у связаны соотношением х+у=р. Таким образом, экстремум функции ищется только на множестве тех точек плоскости R2, которые удовлетворяют указанному соотношению. Эта конкретная задача, конечно, решается без труда : достаточно, записав, что у=р-х, подставить это выражение в формулу для    (х,у) и найти обычными методами максимум функции х(р-х). Она нам была нужна лишь для постановки вопроса. В следующих пунктах мы рассмотрим общий случай решения подобных задач.

4.2. Понятие условного экстремума

Пусть на открытом множестве  G   Rn  заданы функции.

yi=fi(x)   i=1,2,3,…,m                                                            (4.1)

x=(x1,x2,…,xn).Обозначим через Е множество точек x G , в которых все функции fi   i=1,2,3,…,m обращаются в нуль:

E={x: fi(x)=0, i=1,2,3,…,m, x  G}                                         (4.2)

Уравнения

fi(x)=0, i=1,2,3,…,n                                                               (4.3)

 будем называть уравнениями связи.

Определение: пусть на множестве G задана функция y=f0(x). Тогда x(0)  E называется точкой условного экстремума (принят также термин «относительный экстремум») функции f0(x) относительно (или при выполнении) уравнений связи (4.3) , если она является точкой обычного экстремума этой функции, рассматриваемой только на множестве Е.

Иначе говоря, здесь значения функции f0(x) в точке x(0) сравниваются не со всеми ее значениями в достаточно малой окрестности этой точки , а только со значениями в точках, принадлежащих одновременно указанной достаточно малой окрестности и множеству Е. Как и в случае обычных экстремумов , можно , естественно , рассматривать точки просто условного экстремума и точки строго условного экстремума.

Будем предполагать, что

все функции f0,f1,f2,…, fm непрерывно дифференцируемы в открытом множестве G;

в рассматриваемой точке x(0) векторы    f1, f2,…, fm линейно независимы , т.е. ранг матрицы Якоби

                                               fj            j=1,2,…,m

                                                                       xi           i=1,2,…,n

равен m-числу ее строк (строки матрицы Якоби являются компонентами градиентов    f1,   f2,…,  fm).

Это означает, что функции системы (4.1) независимы в некоторой окрестности точки x(0).Поскольку в n-мерном пространстве не может быть больше чем n линейно-независимых векторов и ранг матрицы не может быть больше чикла столбцов[10], то из условия 2) следует ,что m<n.

Согласно условию 2) в точке x(0) хотя бы один из определителей вида

                             (f1, f2,…, fm)

                                           (xi1,xi2,…,xim)

отличен от нуля. Пусть для определенности в точке x(0).

                              (f1, f2,…, fm)

                              (xi1,xi2,…,xim)                                                    (4.4)

Тогда, в силу теоремы о неявных функциях , систему уравнений (4.3) в некоторой окрестности точки x(0)=(x1(0),x2(0),…,xn(0))  можно разрешить относительно переменных  x1,x2,…,xm :

                    x1=    1( x1,x2,…,xm)

                    x2=    2( x1,x2,…,xm)

                    ……………………                                      (4.5)

                    xm=    m( x1,x2,…,xm)

Поставив значения x1,x2,…,xm, даваемые формулами (4.5) в y=f0(x), т.е. рассмотрев композицию функции f0 и  1, получили функцию

y= f0(    1( xm+1,…,xn),…,    m( xm+1,…,xn), xm+1,…,xn)==                      

=0( xm+1,…,xn)                                                                  (4.6)

от n-m переменных xm+1,…,xn,определенную и непрерывно дифференцируемую в некоторой окрестности точки x(0)=(x1(0),x2(0),…,xn(0))  в (n-m)–мерном пространстве Rn-m.

Поскольку, согласно теореме о неявных функциях, условия (4.3) и (4.5) равносильны ,то справедливо следующее утверждение.

Точка x(0) является точкой (строгого) условного экстремума для функции g относительно уравнений связи (4.3) в том и только том случае, когда x(0) является точкой обычного (строгого) экстремума (4.6).

Если x(0)– точка обычного экстремума функции g, то она является стационарной точкой этой функции:

       dg (x(0))=0                                                                                (4.7)

Напомним, что дифференциал – линейная однородная функция и его равенство нулю означает равенство нулю этой функции при любых значениях ее аргументов , в данном случае – при любых dxm+1, dxm+2,…, dxn. Это возможно ,очевидно , в том и только том случае , когда все коэффициенты при этих аргументах , т.е. производные  g/  xm+k, k=1,2,…,n-m обращаются в нуль в точке x(0).Условие (4.7) необходимо для условного экстремума в точке x(0).

Заключение

Математический анализ это совершенно естественная, простая и элементарная наука, ничуть не более заумная, сложная или “высшая”, чем, скажем, “элементарная” геометрия. Многие теоремы, традиционно входившие в курс геометрии, куда сложнее, чем основополагающие теоремы классического анализа. Ныне противопоставление элементарной математики и анализа непродуктивно, и вовсе необязательно проявлять бездну остроумия только лишь из боязни использовать свойства производной.

Привнесение элементов математического анализа в школьные программы неизбежно приведет к перестройке и других областей математического образования – изменится содержание конкурсных задач, кружковой работы, математических олимпиад и многого другого. Теперь уже невозможно не учитывать, что школьник должен знать нечто из ранее недоступной ему высшей математики.

При этом следует иметь в виду, что если освоены лишь самые основы математического анализа, можно уже делать попытки подобраться ко многим современным проблемам.

При рассмотрении данной темы проекта теоретические сведения подтвердились практическим доказательством и математическим обоснованием.

Библиография

1.     Бермант А.Ф., Араманович И.Г. Краткий курс математического анализа.-М.: Наука, 1973.

2.     Жак И.Е. ифференциальное исчисление. - М.: Государственное учебно-педагогическое издательство министерства просвещения РСФСР, 1960.

3.     Запорожец Г.И. Руководство к решению задач по математическому анализу. - М.: Высшая школа,1966.

4.     Зорич В.А. Математический анализ. - М.: Наука, 1981.

5.     Картышев А.П., Рождественский Б.Л. Математический анализ. - М.: Наука, 1984.

6.     Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. - М.: Наука, 1981.

7.     Кудрявцев Л.Д. Курс математического анализа. - М.: Высшая школа, 1981.

8.     Моркович А.Г., Солодовников А.С. Математический анализ. - М.: Высшая школа, 1990.

9.     Пискунов Н.С. Дифференциальное и интегральное исчисление. т.1.-М.: Наука, 1978.

10.                       Рыбников К.А. История математики. - М.:Издательство Московского университета, 1994.

11.                       Тихомиров В.М. Рассказы о максимумах и минимумах. - М.:Наука, 1986.

12.                       Фихтенгольц Г.М. Основы математического анализа. т.2.-М.: Наука, 1968.

13.                       Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. т.1.-М.: Наука, 1969.


[1] Картышев А.П., Рождественский Б.Л. Математический анализ. - М.: Наука, 1984, стр. 40

[2] Запорожец Г.И. Руководство к решению задач по математическому анализу. - М.: Высшая школа,1966, стр. 91

[3] Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. - М.: Наука, 1981, стр. 342

[4] Моркович А.Г., Солодовников А.С. Математический анализ. - М.: Высшая школа, 1990, стр. 274

[5] Фихтенгольц Г.М. Основы математического анализа. т.2.-М.: Наука, 1968, стр. 126

[6] Тихомиров В.М. Рассказы о максимумах и минимумах. - М.:Наука, 1986, стр. 63

[7] Зорич В.А. Математический анализ. - М.: Наука, 1981, стр. 74

[8] Пискунов Н.С. Дифференциальное и интегральное исчисление. т.1.-М.: Наука, 1978, стр. 176

[9] Жак И.Е. дифференциальное исчисление. - М.: Государственное учебно-педагогическое издательство министерства просвещения РСФСР, 1960, стр. 45

[10] Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. т.1.-М.: Наука, 1969, стр. 77