Приближенные методы решения алгебраического уравнения

Министерство науки и образования Украины

Днепропетровский Национальный Университет

                                                                                               

Радиофизический факультет

Кафедра физики СВЧ

Реферат по курсу

численных методов:

тАЬПриближённые методы решения алгебраичекого уравнениятАЭ

Выполнил:

Студент

группы РЭтАУ01-1                                                                                                                                                                          

       

Проверил:

Доцент кафедры

физики СВЧ                                                                                                             К. В. Заболотный                                                           

Днепропетровск 2002

Содержание

  1. Численное решение уравнения, условия, наложенные на функцию, графический метод определения корней.
  2. Метод дихотомии.
  3. Метод итераций
  4. Быстрота сходимости процесса итераций
  5. Метод касательных
  6. Первые приближения для метода касательных
  7. Метод секущих
  8. Метод хорд
  9. Усовершенствованный метод хорд
  10. Комбинированный метод решения уравнения
  11. Заключительные замечания
  12. Список использованной литературы
1. Численное решение уравнений с одним неизвестным

          В данной работе рассматриваются метода приближённого вычисления действительных корней алгебраического или трансцендентного уравнения

                                                                            f(x)=0                                                                   (1.1)

на заданном отрезке [a, b].

         

         Уравнение называется алгебраическим, если заданная функция есть полином n-ой степени:

f(x) = P(x) = a0xn + a1xn- 1 + тАж + an-1 x + an = 0,  a0 ≠ 0

         Требование a0 ≠ 0 обязательно, так как при невыполнении этого условия данное уравнение будет на порядок ниже.

         Всякое уравнение (1.1) называется трансцендентным, если в нём невозможно явным образом найти неизвестное, а можно лишь приближённо.

         Однако в число алгебраических уравнений можно также включить те уравнения, которое после некоторых преобразований, можно привести к алгебраическому.

         Те методы, которые здесь рассматриваются, применимы, как к алгебраическим уравнениям, так и к трансцендентным

.

         Корнем  уравнения (1.1) называется такое число ξ, где f(ξ)=0.  

         При определении приближённых корней уравнения (1.1) необходимо решить две задачи:

  1. отделение корней, т. е. определение достаточно малых промежутков, в каждом из которых заключён один и только один корень уравнения (простой и кратный);
  1. уточнение корней с заданной точностью (верным числом знаков до или после запятой);

          Первую задачу можно решить, разбив данный промежуток на достаточно большое количество промежутков, где бы уравнение имело ровно один корень: на концах промежутков имело значения разных знаков. Там где данное условие не выполняется, те промежутки откинуть.

         Вторая задача решается непосредственно в методах рассмотренных ниже.

   

         При графическом отделении корней уравнения (1.1) нужно последнее преобразовать к виду: 

                                                                        φ1(x)=φ2(x)                                                              (2.1)

и построить графики функций y1=φ1(x),  y2=φ2(x).

          Действительно,  корнями уравнения (1.1)

f(x) = φ1(x) - φ2(x) = 0

являются абсциссы точек пересечения этих графиков (и только они).

          Из всех способов, какими можно уравнение (1.1) преобразовать к виду (2.1) выбираем тот, который обеспечивает наиболее простое построение графиков y1=φ1(x) и  y2=φ2(x). В частности можно взять φ2(x) = 0 и тогда придём к построению графика функции (1.1), точки пересечения которого с прямой y2=φ2(x)=0, т. е. с осью абсцисс, и есть искомые корни уравнения (1.0).             

          Условия, наложенные на функцию f(x) на  отрезке [a, b].

          Будем предполагать, что функция  f(x) непрерывна на отрезке [a, b] (для метода хорд можно потребовать на интервале)  и имеет на этом интервале первую и вторую производные, причём обе они знакопостоянны (в частности отличны от нуля). Будем также предполагать, что функция  f(x) принимает на концах отрезка значения разного знака. В силу знакопостоянства первой производной функция f(x) строго монотонна, поэтому при сделанных предположениях уравнение (1.1) имеет в точности один корень на интервале        (a, b).         

2. Метод дихотомии

   

         Этот метод ещё называется методом вилки.

         Нам необходимо найти корень уравнения (1.1) на отрезке [a, b]. Рассмотрим отрезок   [x0, x1]: [x0, x1]⊂[a, b]. Пусть мы нашли такие точки х0, х1, что f (х0) f(х1) ≤ 0, т. е. на отрезке [х0, х1] лежит не менее одного корня уравнения. Найдём середину отрезка х2=(х0+х1)/2 и вычислим  f(х2).  Из двух половин  отрезка  выберем  ту,  для  которой  выполняется   условие

f (х2) f(хгран.) ≤ 0, так как один из корней лежит на этой половине. Затем новый отрезок делим пополам и выберем ту половину, на концах которой функция имеет разные знаки, и т. д.  (рис 1.2).

          Если требуется найти корень с точностью Е, то про-

должаем деление пополам до тех пор, пока  длина отрезка

не станет меньше 2Е. Тогда  середина последнего отрезка

даст значение корня с требуемой точностью.

          Дихотомия  проста  и  очень  надёжна.  К  простому  

корню она  сходится  для  любых  непрерывных  функций

в том числе и не дифференцируемых; при этом она устой-

чива  к ошибкам округления. Скорость сходимости не ве-

лика; за одну итерацию  точность  увеличивается пример-

но вдвое, т. е. уточнение трёх  цифр требует 10 итераций.

Зато точность ответа гарантируется.                                                                     рис. 1.2

          Приступим к доказательству того, что если непрерывная функция принимает на концах некоторого отрезка [a, b] значения разных знаков, то методом дихотомии однозначно будет найден корень.

         Предположим для определённости, что функция  f(x) принимает на левом конце отрезка [a, b] отрицательное значение, а на правом тАУ положительное:

f(a) < 0,  f(b) > 0.

          Возьмём среднюю точку отрезка [a, b], h=(a+b)/2 и вычислим значение в ней функции f(x). Если f(h)=0, то утверждение теоремы доказано: мы нашли такую точку, где функция обращается в нуль. Если f(h)≠ 0, тогда из отрезков [a, h] и [h, b] выберем один из них тот, где функция на его концах принимает значения разных знаков. Обозначим его [a1, b1]. По построению: f(a1)<0, f(b1)>0. Затем среднюю точку отрезка [a1, b1] точку h1 и проведём тот же алгоритм нахождения другого отрезка [a2, b2] где бы по построению f(a2)<0, f(b2)>0.              Будем продолжать этот процесс. В результате он либо оборвётся на некотором шаге n в силу того, что f(hn)=0, либо будет продолжаться неограниченно. В первом случае вопрос о существовании корня уравнения f(x)=0 решён, поэтому рассмотрим второй случай.

            Неограниченное продолжение процесса даёт последовательность отрезков [a, b],        [a1, b1], [a2, b2],тАж Эти отрезки вложены друг в друга тАУ каждый последующий отрезок принадлежит всем предыдущим:

                                                                an ≤ an+ 1 < bn+ 1 ≤  bn                                                      (1.2)

причём:

f(an) < 0,  f(bn) > 0

       

        Длины отрезков с возрастанием номера n стремятся к нулю:

         Рассмотрим левые концы отрезков. Согласно (1.2) они образуют монотонно убывающую ограниченную последовательность {an}. Такая последовательность имеет предел, который можно обозначить через c1:

Согласно (1.1) и теореме о переходе к пределу в неравенствах имеем:

                                                                            c1 ≤  bn                                                                 (2.2)          

        Теперь рассмотрим правые концы отрезков. Они образуют монотонно не возрастающую ограниченную последовательность {bn}, которая тоже имеет предел. Обозначим его через    с2: . Согласно неравенству (2.1) пределы с1 и с2 удовлетворяют неравенству  с1 ≤ с2. Итак, an ≤ с1 < с2 ≤  bn, и следовательно:

с2-с1 ≤ bn - an=(b-a)/2n.

         Таким образом, разность с2-с1 меньше любого наперёд заданного положительного числа. Это означает, что с2-с1=0, т. е.: с1=с2=с

         Найденная точка интересна тем, что она является единственной общей точкой для всех отрезков построенной последовательности  Используя непрерывность функции f(x), докажем, что она является корнем уравнения f(x)=0.

        Мы знаем, что f(an)<0. Согласно определению непрерывности и возможности предельного перехода в неравенствах, имеем:

                                                                    f(c)=lim f(an)≤0                                                           (3.2)

         Аналогично, учитывая, что f(bn)≥0, получаем, что:

                                                                   f(c)=lim f(bn) ≥0                                                           (4.2)

                                                     

         Из (3.2) и (4.2) следует, что f(c)=0. т. е. с тАУ корень уравнения.

           

         Процесс построения последовательности вложенных стягивающих отрезков методом вилки (дихотомии) является эффективным вычислительным алгоритмом решения уравнения f(x)=0. На n-ом шаге процесса получаем:

an ≤ c ≤ bn

          Это двойное неравенство показывает, что число an определяет корень с недостатком, а число bn с избытком, с ошибкой не превышающей длину отрезка Δn=bn-an=(b-a)/2n. При увеличении n ошибка стремится к нулю по закону геометрической прогрессии со знаменателем q=0.5. Если задана требуемая точность ε>0, то чтобы её достигнуть достаточно сделать число шагов N, не превышающее log2[(b-a)/ε]:  N>log2[(b-a)/ε].

3. Метод итераций

          Этот метод называется ещё методом последовательных приближений.

          Пусть нам необходимо найти корень уравнения (1.1) на некотором отрезке [a, b].

          Предположим, что уравнение (1.0) можно переписать в виде:

                                                                         x=φ(x)                                                                    (1.3)

           Возьмём произвольное значение  x0 из области определения функции φ(x) и будет строить последовательность чисел {xn}, определённых с помощью рекуррентной формулы:

                                                           xn +1=φ(xn),     n=0, 1, 2, тАж                                                 (2.3)

          Последовательность {xn} называется итерационной последовательностью. При её изучении встают два вопроса:

  1. Можно ли процесс вычисления чисел xn  продолжать неограниченно, т. е. будут ли числа xn  принадлежать отрезку [a, b] ?
  2. Если итерационный процесс (2.3) бесконечен, то как ведут себя числа xn  при n→∞

         Исследование этих вопросов показывает, что при определённых ограничениях на функцию φ(x) итерационная  последовательность является бесконечной и сходится к корню уравнения (1.3).

                                                          ,    c=φ(c)                                                             (3.3)

          Однако для того, чтобы провести это исследование нам нужно ввести новое понятие.

          Говорят, что функция  f(x) удовлетворяет на отрезке [a, b] условию Липшица, если существует такая постоянная  α, что для любых x1, x2,  принадлежащих отрезку [a, b] имеет место неравенство:

                                                               | f(x1) - f(x2)| ≤ α|x1 - x2|                                                   (4.3)

           Величину α в этом случае называют постоянной Липшица.

           Если функция  f(x), удовлетворяет на отрезке [a, b] условию Липшица, то она непрерывна на нём. Действительно, пусть x0 тАУ произвольная точка отрезка. Рассмотрим приращение функции f(x) в этой точке:

Δf=f(x0+Δx) тАУ f(x0)

и оценим его с помощью неравенства (4.3)

|Δf | ≤ α|Δx|

         Таким образом,  , что означает непрерывность функции f(x).

         Условие Липшица имеет простой геометрический смысл. Возьмём не графике функции y=f(x) две произвольные точки M1 и M2 с координатами (x1, f(x1)) и (x2, f(x2)). Напишем уравнение прямой линии, проходящей через эти точки:

y=f(x1) + k(x-x1)

         где kтАУ тангенс угла наклона прямой у оси Оx и определяется формулой:

         Если функция f(x) удовлетворяет на отрезке  [a, b]  условию Липшица, то при произвольном выборе точек M1 и M2 имеем |k|≤α. Таким образом, с геометрической точки зрения условие Липшица означает ограниченность тангенса угла наклона секущих, проведённых через всевозможные пары точек графика функции y=f(x).

      рис 2.3                                                                                     рис 3.3

             геометрическая иллюстрация                                           геометрическая иллюстрация   

             условия Липшица.                                                                cвязи условия Липшица с пред-      

                                                                                                           положением о дифференциру-

                                                                                                           емости  функции.

           Предположим, что функция  f(x) имеет  на отрезке [a, b]  ограниченную  производную:

| f ′(x)| ≤ m; тогда она удовлетворяет условию Липшица с постоянной α=m. Для доказательс-        тва этого утверждения воспользуемся  формулой конечных приращений Лагранжа:

                                                           f(x2) тАУ f(x1) = f ′(ξ)(x2-x1)                                                     (5.3)

где x1, x2, - произвольные точки отрезка [a, b] ξ, - некоторая точка отрезка [x1, x2]. Возьмём модуль обеих частей равенства (4.3) и заменим в правой части  | f тАШ(x)| на m. В результате по- лучим неравенство (4.3) с α=m. Рис.2.3 даёт геометрическую иллюстрацию установленного свойства. Согласно формуле Лагранжа (5.3) каждой секущей графика функции y = f(x) мож- но поставить в соответствие параллельную её касательную. Поэтому наибольший тангенс угла наклона касательных, и его можно оценить той же константой  m: |k| ≤ m.

         Познакомившись с условием Липшица, перейдём к изучению итерационной последовательности, предполагая, что уравнение имеет корень x=c. Существование этого корня можно установить с помощью качественного предварительного исследования уравнения с применением теоремы о существовании корня непрерывной функции.

        

Теорема о существовании корня непрерывной функции

         Если функция  f(x) непрерывна на отрезке [a, b] и принимает на его концах значения разных знаков, то на этом отрезке существует, по крайней мере, один корень уравнения f(x).

         Теорема о сходимости  итерационной последовательности

         Пусть с тАУ корень уравнения (2.3) и пусть функция φ(x) удовлетворяет на некотором отрезке   [c-δ, c+δ] (δ>0) условию Липшица с постоянной α<1. Тогда при любом выборе x0 на отрезке [c-δ, c+δ] существует бесконечная итерационная последовательность {xn} и эта последовательность сходится к корню x=c, который является единственным решением уравнения (1.3) на отрезке [c-δ, c+δ].

         Сформулированная теорема имеет очень простой смысл. Будем говорить, что функция φ осуществляет отображение точки x на точку y=φ(x). Тогда условие Липшица  с постоянной α<1 означает, что отображение φ является сжимающим: расстояние между точками x1 и x2 больше, чем расстояние между их изображениями y1=φ(x1) и y2=φ(x2).

         Корень c является  неподвижной точкой отображения φ, он преобразуется сам в себя c=φ(c). Поэтому каждый шаг в итерационном процессе, сжимая расстояния должен приближать члены последовательности {xn} к неподвижной точке c.

         После таких соображений поясняющих смысл теоремы, перейдём к её доказательству. Возьмём произвольную точку x0 на отрезке [c-δ, c+δ], она отстоит от точки c не больше чем на δ: |c-x0| ≤ δ.

         Вычислим x1: x1=φ(x0), при этом x1-c =φ(x0)-φ(c). Разность φ(x0)-φ(c) можно оценить с помощью условия Липшица:

                                                        |x1-c| = |φ(x0)-φ(c)| ≤ |x0-c| ≤ αδ.                                           (6.3)

         Неравенство (6.3) показывает, что x1 принадлежит отрезку [c-δ, c+δ] и расположен ближе к точке c, чем x0.

         Продолжим построение итерационной последовательности. Вычислим x2: x2=φ(x1), при  этом:

|x2-c| = |φ(x1)-φ(c)| ≤ α|x1-c| ≤ α2|x0-c| ≤ α2δ

         Точка x2 опять принадлежит отрезку [c-δ, c+δ]  и расположена ближе к точке c, чем точка x1, т.е. мы приблизились к c.

         По индукции легко доказать, что последующие итерации также существуют и удовлетворяют неравенствам.

                                                              |xn-c| ≤ αn |x0-c| ≤ αnδ                                                       (7.3)

         Отсюда следует, что:

,  т. е.

          Остаётся доказать, что корень x=c (1.3) является единственным решением уравнения на отрезке [c-δ, c+δ]. Действительно, допустим,  что существует ещё один корень x=c1.

         Примем c1 за нулевое приближение и будем строить итерационную последователь- ность (2.3). Тогда с учётом (7.3) получим xn=c1 (n=0, 1, 2, тАж). С другой стороны, по доказанному , т. е. c1=c. Никаких других  решений уравнение на отрезке иметь не может.             

         Сходимость   итерационной  последовательности  к  корню  уравнения  (1.3)  может  быть использована для приближённого определения корня с любой степенью точности. Для этого нужно только провести достаточное количество итераций.

4. Быстрота сходимости процесса итераций

          Используем теперь производную функции φ(x) для оценки скорости сходимости итераций при решении уравнения х=φ(x). Нужно оценить скорость, с которой убывают погрешности αn=ξ-xn приближённых значений х1, тАж , хn, тАж корня ξ.

 

  

                  рис 1.4

         Можно заметить,   что   справедливы   равенства  ξ=φ(ξ)  и  хn+ 1=φ(хn).   Из  них   вытекает,  что:

αn+ 1= ξ-хn+ 1=φ(ξ)-φ(хn)

         Но по формуле Лагранжа имеем:

φ(ξ)-φ(хn)= φ ′(cn)В·( ξ-xn)= φ ′(cn) В·αn                                 

         где  cn - точка лежащая между точками ξ и хn. Поэтому:

                                                                    αn+ 1=φ ′(cn) В·αn                                                           (1.4)

      

         Из равенства (1.4) вытекает следующий вывод:

        Пусть ξ тАУ корень уравнения  x=φ (x) - лежит на отрезке [a, b]. Если на этом отрезке выполняется неравенство |φ ′(x)|<q<1, а начальное приближение  x1 также выбрано на отрезке [a, b], то при любом n выполняется соотношение:

                                                                      |αn+ 1|<qnВ·|α1|                                                             (2.4)

           В самом деле, из равенства (1.4) имеем:

|α2|=|φ ′(c1)|В·|α1|

           Но точка c1 лежит на отрезке [a, b] (рис.1.4), и потому:

|φ ′(c1)|<q

           Отсюда следует, что:

|α2|<qВ·|α1|

           Точно так же получаем, что:

|α3|=|φ ′(c1)|В·|α2|<qВ·|α2|< q2В·|α1|

            и вообще:

|αn+ 1|=qnВ·|α1|

           Тем самым наше утверждение доказано.

      

            Так само при  0<q<1  последовательность чисел q, q2, q3, тАж , qn, тАж  стремится к нулю, то и погрешность αn+ 1 стремится к нулю с возрастанием n. Иными словами, при указанных выше предположениях числа x1, x2, тАж , xn, тАж приближаются к числу ξ, причём разность       |ξ-xn|  убывает быстрее, чем qnВ·|α1|.

        Точно так же можно доказать, что если на отрезке [a, b]  выполнено неравенство:

|φ ′(x)|>1,

то процесс итераций расходится.

          Особенно быстро сходится процесс последовательных приближений, если в точке ξ производная функции φ(x) обращается в нуль. В этом случае по мере приближения к  ξ, значение φ ′(x) стремится к нулю. Так как:

|αn+ 1|=|φ ′(cn)|В·|αn|

то сходимость процесса ускоряется по мере приближения к точке ξ.

           Однако то же самое можно наблюдать в методе Ньютона, при замене f(x)=0 на имеем: и её производная: в точке ξ:  f(ξ)=0 - в  методе Ньютона наблюдается ускорение  сходимости процесса приближений.  

5. Метод касательных (метод Ньютона)

         Метод касательных, связанный с именем И. Ньютона, является одним из наиболее эффективных численных методов решения уравнений. Идея метода очень проста. Возьмём производную точку x0 и запишем в ней уравнение касательной к графику функции f(x):

                                                                 y=f(x0)+ f ′(x) (x-x0)                                                       (1.5)

          Графики функции f(x) и её касательной близки около точки касания, поэтому естественно ожидать, что точка x1 пересечения касательной с осью Ox будет расположена недалеко от корня  c (рис. 1.5)

         Для определения точки имеем уравнение:

f(x0)+ f ′(x0) (x1-x0)=0

таким образом:                                    x1=x0 тАУ f (x0)/ f ′(x0)                                                          (2.5)

         Повторим  проделанную процедуру: напишем уравнение  касательной  к графику функции f(x) при x=x1 и найдём для неё точку пересечения x2 с осью Ox  (см. рис.1.5)        x2=x1 тАУ f (x1)/ f ′(x1). Продолжая этот процесс, получим последовательность {xn}, определён- ную с помощью рекуррентной формулы: 

                                                       xn+ 1=xn тАУ f (xn)/ f ′(xn), n=0, 1, 2, тАж                                        (3.5)

    

         При исследовании этой последовательности, как и последовательности метода итераций, встают два вопроса:

                     

  1. Можно ли процесс вычисления чисел xn продолжать  неограниченно, т. е.  будут ли числа xn принадлежать  отрезку [a, b] ?
  2. Если процесс (3.5) бесконечен,  то  как  ведёт себя последовательность {xn}  при n→∞ ? 

                       рис. 1.5          

      Построение последовательности                                                                  

      {xn}по методу касательных

                                                                                                                                                                                                                                    

           При анализе этих вопросов предположим, что корень x=c является внутренней точкой отрезка [a, b] (a<c<b), а функция f(x) дважды дифференцируема на данном отрезке, причём её производные удовлетворяют неравенствам:

                                                        | f ′(x)|≥m>0,  | f ′′(x)|≤M,  x∈[a, b],                                      (4.5)

и докажем следующую теорему.

         Теорема о сходимости метода касательных.

         Если функция f(x) удовлетворяет условиям, сформулированным п.1., то найдётся такое                 δ: 0<δ≤min(cтАУa, bтАУc), что при любом выборе начального приближения на отрезке                  [c-δ, c+δ] ⊂ [a, b]  существует бесконечная итерационная последовательность (3.5) и эта последовательность сходится к корню c.

         Доказательство. В силу предположения о дифференцируемости функции f(x) и не равенстве нулю её производной f ′(x) уравнение f(x)=0 эквивалентно на отрезке [a, b] уравне-     нию:

                                                           x=φ(x), φ(x)=xтАУ f (x)/ f ′(x)                                                  (5.5)

так что корень x=c исходного уравнения является одновременно корнем уравнения (5.4).      

         Исследуем возможность отыскания этого корня с помощью итераций.

         Вычислим производную функции φ(x):

                                                                         (6.5)

и оценим полученное выражение. Согласно неравенствам (4.5):

                                                                                                                      (7.5)

         Для дальнейшей оценки  ||  воспользуемся непрерывностью функции f(x) и равенством её нулю в точке x= с:

                                                                                                                        (8.5)

          Положим ε=m2/(2M)

          Тогда в силу (8.5) для данного ε можно указать такое δ: 0<δ≤ min (cтАУa, bтАУc), что для всех выполняется неравенство:

                                                                                                    (9.5)

          Учитывая это, получим:

                                                                                                                 (10.5)

          Таким образом, функция φ(x) удовлетворяет на отрезке [c-δ, c+δ] ⊂ [a, b]  условию Липшица с постоянной  α=0.5<1. Это означает, что уравнение (5.5) можно решать методом итераций: при любом выборе нулевого приближения x0 на отрезке [c-δ, c+δ] существует бесконечная последовательность {xn}, xn+1=φ(xn),     n=0, 1, 2, тАж, сходящаяся  к корню x=c.

           Теперь нам остаётся заметить, что итерационной последовательностью для уравнения (5.5), сходимость которой мы только что установили, является последовательность (3.5) метода касательных. Теорема доказана. 

         Требование близости нулевого приближения x0 к искомому корню c является существенным для метода касательных. На рис.2.5 изображён график, где х0 выбрано неправильно, то есть расстояние сх0>ас, так как ас<bс. В результате чего х1 не принадлежит отрезку [a, b], и на этом процесс построения рекуррентной последовательности метода касательных обрывается.        

                                                                            

          Таким образом, до начала расчётов по данному методу для выбора нулевого приближения х0 нужно знать область локализации искомого корня х=с. Если известен в общих чертах график функции f(x), то его легко определить по этому графику. В случае необходимости можно сделать несколько шагов по методу вилки. Затруднения, связанные с предварительным исследованием уравнения, вполне окупаются высокой скоростью сходимости метода.                         

           рис. 2.5 Случай,  когда  процесс построения после-                                                                                                                                            

                        довательности {xn} обрывается из-за пло-                                               

                        хого выбора нулевого приближения

             

6. Первые приближения для метода касательных

Первые нулевые приближения для метода Ньютона, для итерационной последовательности, можно так же найти другим путём. Если нам известно, что функция f(x) на отрезке [a, b] непрерывна и дважды дифференцируема, и имеет ровно один корень, тогда можно взять за нулевое приближение значение одного из концов отрезка [a, b] в зависимости от знака второй производной, иначе при первом же приближении можно попасть за пределы отрезка [a, b] (рис. 1.6).

          То есть можно сформулировать следующее правило:

          Пусть в точках a и b функция f(x) имеет различные знаки, причём на отрезке [a, b] вторая производная положительна. Тогда за начальное приближение х1 надо выбирать ту из точек a или b, в которой функция f(x) принимает положительное значение. Если же на отрезке [a, b] вторая производная отрицательна, то за начальное приближение x1 надо выбирать ту точку, в которой функция  f(x) принимает отрицательное значение.

7. Метод секущих

          В методе Ньютона (касательных) требуется вычислять производную функции, что не всегда удобно. Можно заменить производную функции первой разделённой разностью, найденной по двум последним итерациям, т. е. заменить касательную секущей. Тогда вместо процесса    получим: 

                                             (1.7)

для начала процесса необходимо задать х0 и х1 (рис. 1.7). Такие процессы, где для вычисления очередного приближения надо знать два предыдущих, называют двух шаговыми.

                               

           Эти изменения сильно меняют характер итераций. Например, сходимость итераций может быть немонотонной не только вдали от корня, но и малой окрестности корня. Скорость сходимости также изменяется. Его можно оценить, разлагая все функции в (1.7) по формуле Тейлора с центром . Получим с точностью до бесконечно малых более высокого порядка:

                                                                                         (2.7)

            Решение этого рекуррентного соотношения естественно искать в виде аналогичном методу Ньютона: . Подставляя эту форму в соотношение (2.6), получим:

 

                                                                αβ=1, β2 - β - 1 = 0                                                         (3.7)

            Только положительный корень β квадратного уравнения (3.6) соответствует убыванию ошибки, т. е. сходящемуся процессу. Следовательно, в методе секущих

в то время как в методе Ньютона ошибка убывает быстрей (соответствуя β=2). Но в методе на каждой итерации надо вычислять и функцию, и производную, а в методе секущих тАУ только функцию. Поэтому при одинаковом объёме вычисления в методе секущих можно сделать вдвое больше итераций и получить более высокую точность. Что является более приемлемым при численных расчётах на ЭВМ, чем метод касательных.

         В знаменателе формулы (1.7) стоит разность значений функции. Вдали от корня это несущественно; но вблизи  корня, особенно корня высокой кратности, значения функции малы и очень близки. Возникает потеря значащих цифр, приводящая к ВлразболткеВ» счёта. Это ограничивает точность, с которой можно найти корень; для простых корней это ограничение невелико. Приводить к общему знаменателю уравнение (1.7) не следует: может увеличится потеря точности в расчётах.

         От ВлразболткиВ»  страхуются так называемым приёмом Гарвика. Выбирают не очень малое ε, ведут итерации до выполнения |xn+ 1-xn|<ε  и затем продолжают расчёт до тех пор, пока | xn+ 1-xn | убывают. Первое же возрастание обычно означает начало ВлразболткиВ»; тогда расчёт прекращают и последнюю итерацию не используют.

8. Метод хорд, или линейной аппроксимации

           Рассмотрим задачу решения уравнения  (1.1) методом хорд.                     

                                                                                                             

           Этот метод состоит в следующем. График функции f(x) заменяется её хордой, т. е. отрезком соединяющий концевые точки графика функции f(x): точки (a, f(a)) и (b, f(b)). Абсцисса х1 точки пересечения этой хорды с осью Ох и рассматривается, как первое приближение искомого корня (рис 1.8). Далее берётся тот из отрезков [a, x1] и [x1, b], на  концах которого, функция  f(x) принимает значения разного знака (далее будет показано, что при сделанных предположениях  f(x) ≠ 0 и, следовательно,   такой  отрезок   всегда  существует), и к нему применяется  тот же приём;  получается  второе приближение  корня х2

и т. д. В результате  образуется  последовательность хn,  n=1, 2, тАж которая,  как это будет по-

казано, при  сделанных  ограничениях на  функцию  f(x),  сходится  к  корню  уравнения   f(x).

Легко получить  рекуррентные формулы  для  указанных  чисел хn,  n=1, 2,тАж Уравнение пря-

мой, проходящее через крайние точки графика функции  f(x) имеет вид:

            (1.8)

          Обозначим его правую часть через l(x),  т. е. Запишем уравнение в виде:

       y = l(x)

          Найдём абсциссу х1 точки пересечения прямой (1.8) с осью Ох, т. е. Решим уравнение l(x)=0; получим:

                                                                                                                      (2.8)

            Легко убедится, что:

                                                                            a < x1 < b                                                            (3.8)

            Это, например, следует из строгой монотонности и непрерывности функции l(x) и того, что на концах отрезка [a, b] она принимает значения разного знака:  l(a)=f(a) и l(b)=f(b).

          Аналогично находим

                                                           n=1, 2, тАж                                (4.8)

          Покажем, что последовательность {xn} стремится к корню уравнения (1.0) монотонно.

          Предположим для определённости, что  f ′(x) и f ′′(x) >0, a<x<b (рис 1.8). В этом случае функция f(x) строго монотонна и строго выпукла вниз. Следовательно, любая внутренняя точка хорды, соединяющей крайние точки графика функции f(x), лежит над соответствующей точкой графика функции f(x), т. е.

l(x) > f(x),  a > x > b

            В частности, если х0 корень уравнения (1.1):  f(x0) = 0, отсюда следует, что

l(x0) > 0

             C (3.8) и (4.8) получаем:

l(x) = 0,  a > x1 > b

             Таким образом,

                                                                      l(x1)  <  l(x0)                                                              (5.8)

             но линейная функция l(x) строго монотонно возрастает, так как

  l(b) = f(b) > f(a) = l(a)

поэтому из (5.8) следует  x1 < x0 , заменяя теперь отрезок [a, b] отрезком [x1, b] и замечая, что f(x1) < 0 , аналогично можно доказать, что x1 < x2 < x0, далее по индукции получим: 

x1 < x2 < тАж < xn < тАж < x0,

Таким образом, последовательность {xn}, будучи монотонной, сходится. Пусть lim xn = c, при n→∞ . Переходя к пределу при n→∞ в равенстве (4.8) получим f(c)=0, т. е. последовательность {xn} сходится к корню уравнения (1.1).

           Если | f ′(x)|≥m>0, a<x<b, то не трудно получить оценку погрешности сходимости последовательности {xn} через значения самой функции f(x) в точках xn. Действительно,

  

f(xn)= f(xn)- f(x0)= f ′(ξn)⋅(xn-x0),

xn<ξn<x0,  n = 1, 2, тАж,

         Отсюда:

, n = 1, 2, тАж,

          Остальные случаи, т. е. случаи:

,

рассматриваются аналогично разобранному (рис 2.8).

                                                                                                                 

                                         

.

рис. 2.8

9. Усовершенствованный метод хорд

          Если итерационная последовательность, полученная методом хорд, сходится, то скорость сходимости будет такой же, как и у метода итераций, - погрешность значения корня убывает, как геометрическая прогрессия. Существует усовершенствование способа хорд, дающее гораздо более быструю сходимость. В обычном методе хорд мы на каждом шагу используем один из концов отрезка [a, b] последнее получившееся приближение. Вместо этого можно использовать два последних приближения тАУ ведь они ближе к искомому корню, чем концы отрезка [a, b].

               рис.1.9             а)                     б)      

                                         

                         

         Формула, при которой мы используем два последних приближения, имеет вид:

                                                                                                (1.9)

          При этом а1 вычисляется по формуле:

           а  а2 в зависимости от знаков f(a),  f(b),  f(a1), если f(a)<0,  f(b)>0,

,  f(a1)<0

,  f(a1)>0

            Если случайно окажется, что точка а3, вычисленная по формуле (1.9), лежит за пределами отрезка [a, b], то на следующем шаге надо вместо этой точки взять ближайший к ней конец этого отрезка (рис. 1.9, б). Оказывается, что сходимость усовершенствованного метода хорд гораздо быстрее, чем у обычного. Именно, если ξ - корень уравнения f(x)=0, то:

|an+ 1|<C⋅|an-ξ| S,       где

10. Комбинированный метод решения уравнений

          При решении уравнений часто комбинируют методы хорд и Ньютона. Если график функции y=f(x) обращён вогнутостью вверх, то находят точки а1 и х1 по формулам:

                                                                                                          (1.10)

                                                                                                                               (2.10)

            Если же график функции y=f(x) обращён вогнутостью вниз, то точку а1 находят по формуле (1.10), а точку х1 тАУ по формуле: 

                                                                                                                              (3.10)

             Как видно из рис.1.10 а) и б), корень ξ уравнения f(x)=0 лежит обычно между полученными точками а1 и х1. Применяя снова к этим точкам формулы метода хорд и метода Ньютона, получают новую пару точек а2 и х2 и т. д.

             Таким путём получают две последовательности точек а1, а2, а3, тАж, an, тАж и x1, x2, x3, тАж , xn, тАж, приближаются с разных сторон к искомому корню ξ. Преимущество описанного метода состоит в том, что при нём получаются приближённые значения как с избытком так и с достатком.

рис.1.10

а)                           б)

11. Заключительные замечания

         Ситуация, когда одну и ту же задачу можно решить многими способами, является довольно типичной. В таких случаях естественно возникает необходимость сравнения их между собой.

          При оценке эффективности численных методов существенное значение имеют различные свойства:

  1. универсальность;
  2. простота организации вычислительного процесса и контроля над точностью;
  3. скорость сходимости.
  1. Наиболее универсальным является метод деления пополам (дихотомии): он только требует непрерывности функции. Остальные методы накладывают более сильные ограничения. Во многих случаях это преимущество метода вилки может оказаться существенным.
  1. С точки зрения организации вычислительного процесса все виды численного нахождения корней уравнения очень просты. Однако и здесь метод деления пополам обладает некоторым преимуществом. Вычисления можно начинать с любого отрезка [a, b], на концах которого непрерывная функция f(x) принимает значения разных знаков. Процесс будет сходится к корню уравнения f(x)=0, причём на каждом шаге он даёт для корня двустороннюю оценку, по которой легко определить достигнутую точность. Сходимость же метода итераций или касательных зависит от того, насколько удачно выбрано нулевое приближение.
  1. Наибольшей скоростью сходимости обладает метод касательных. В случае, когда подсчёт значений функции f(x) сложен и требует больших затрат машинного времени, это преимущество становится определяющим. На вопрос о том, какой метод тАУ метод итераций или дихотомия даёт большую скорость сходимости, однозначно ответить нельзя. При методе дихотомии знаменатель геометрической прогрессии убывания погрешности равен q=0.5, а при методе хорд он может принимать значения 0<q<1.  

          Из вышесказанного следует, что ответ на вопрос о наилучшем численном методе решения уравнения не однозначен. Он существенно зависит от того, какую дополнительную информацию о данной функции мы имеем, в соответствие с этим, каким свойствам метода придаём большее значение.

          При обосновании метода итераций и метода Ньютона на функции φ(x) и  f(x), а также на выбор начального приближения х0 накладывались определённые ограничения. Однако при решении конкретных задач проверить их выполнение часто бывает трудно и даже практически не возможно. Функция может не задаваться в виде простой формулы, а находится в результате численного решения некоторой математической задачи, получаться из измерений и проверять ВлэкспериментальноВ»: начинают расчёт и следят за поведением первых членов последовательности {xn}. Если по ним видно, что процесс сходится, то расчёт продолжают, пока не достигнут нужной точности. В противном случае вычисления прекращают и анализируют полученные данные, пытаясь установить причину рассходимости и, в соответствии с ней выбрать другой метод решения задач.   

12. Список использованной литературы:

  1. А. Н. Тихонов, Д. П. Костомаров ВлВводные лекции по прикладной  математикеВ»

            М. ВлНаукаВ» 1984

  1. Л. Д. Кудрявцев ВлМатематический анализ т. 2В» М. 1984 ВлНаукаВ»
  2. П. Ф. Фильчаков ВлСправочник по высшей математикеВ» К. 1973 ВлНаукова ДумкаВ»
  3. Н. Н. Калиткин ВлЧисленные методыВ» М. ВлНаукаВ» 1978
  4. Н. Я. Виленкин ВлИтерационные методыВ» М. ВлНаукаВ» 1984

Вместе с этим смотрят:

Приближенный метод решения интегралов
Призма
Прикладной нестандартный анализ
Применение графиков в решении уравнений