Курсовая работа: Метод наименьших квадратов 2
Название: Метод наименьших квадратов 2 Раздел: Рефераты по математике Тип: курсовая работа | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ Московский Авиационный институт (Государственный технический университет) «МАИ» Кафедра 804 Курсовая работа по курсу «Теория вероятностей и математическая статистика» На тему «Метод наименьших квадратов» Выполнила курсовую работу студентка группы 05-206 Зуева Татьяна Анатольевна Дата сдачи КР Проверил курсовую работу Шин Галина Захаровна Москва 2005 Оглавление 1. Исходные данные………………………………………………….3 2. Постановка задачи…………………………………………………4 3. Теоретическая часть……………………………………………….5 4. Расчетная часть……………………………………………………10 5. График …………………………………………………………….16 6. Приложение………………………………………………………..17 7. Список литературы……………………………………………… 18 1.Исходные данные
Постановка задачи
![]() Числа не соответствуют внутренним числам, так как прибор имеет шумы yt
=axt
+b +εt
, t= где a,b – неизвестные коэффициенты, а εt – независимые в совокупности случайные величины с нормальным законом распределения: εt ~N(0,σ2 ), где σ2 неизвестная дисперсия; 0 – математическое ожидание шума εt . М εt =0, в εt = σ2 . Требуется найти методом наименьших квадратов неизвестные параметры кривой регрессии. y(x)=ax+b– кривая регрессии – условное матожидание случайной величины Y при аргументе x, М(y/x). б). Построить график линии регрессии ỹ(x).
Теоретическая часть 1.Выборка. Математическая статистика – наука о математических методах, позволяющих по статистическим данным, например по реализациям случайной величины (СВ), построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка. Определение 1.
Однородной выборкой (выборкой)
объема n при n Числа, данные, полученные после опыта – апостериорная выборка. Определение 2.
Реализацией
выборки называется неслучайный вектор zn
=col(x1
,…,xn
), компонентами которого являются реализации соответствующих элементов выборки Xi
, i= Из этих определений вытекает, что реализацию выборки zn можно также рассматривать как последовательность x1,…,xnиз n реализаций одной и той же СВ X, полученных в серии из nнезависимых одинаковых опытов, проводимых в одинаковых условиях. Поэтому можно говорить, что выборка Zn порождена наблюдаемой СВ X, имеющей распределение Fx (x)=F(x). Определение 3. Если компоненты вектора Zn независимы, но их распределения F1 (x1 ),…,Fn (xn ) различны, то такую выборку называют неоднородной. Определение 4. Множество Sвсех реализаций выборки Zn называется выборочным пространством. Выборочное пространство может быть всем n-мерным евклидовым пространством Irn или его частью, если СВ X непрерывна, а также может состоять из конечног или счетного числа точек из Irn, если СВ X дискретна. На практике при исследовании конкретного эксперимента распределения F1 (x1 ),…,Fn (xn ) СВ X1 ,…,Xn редко бывают известны полностью. Часто априори (до опыта) можно лишь утверждать, что распределение FZn (zn )=F1 (x1 ),…Fn (xn ) случайного вектора Zn принадлежит некоторому классу (семейству) F. Определение 5. Пара (S,F) называется статистической моделью описания серии опытов, порождающих выборку Zn . Определение 6.
Если распределение FZn
(zn
,Ө
) из класса F определены с точностью до некоторого векторного параметра Ө
В некоторых случаях выборочное пространство может не зависеть от неизвестного параметра Ө распределения FZn (zn ,Ө ). В зависимости от вида статистической модели в математической статистике формулируются соответствующие задачи по обработке информации, содержащейся в выборке. Определение 7. СВ Z=φ(Zn ), где φ(Zn ) – произвольная функция, определенная на выборочном пространстве S и не зависящая от распределения FZn (zn ,Ө ), называется статистикой. 2. Точечные оценки. Определение 2.1.
Параметром
распределения Ө
В общем случае будем предполагать, что параметр распределения Ө
может быть векторным, т.е. Ө
В случае параметрической статистической модели (SӨ
,
FZn
(
zn
,Ө
)) таким параметром распределения может служить неизвестный вектор Ө
Пусть имеется выборка Zn =col(X1 ,…Xn ) с реализацией zn =(x1 ,…xn ). Определение 2.2.
Точечной (выборочной
) оценкой неизвестного параметра распределения Ө
Замечание 2.1.
Реализацию Ясно, что существует много разных способов построения точечной оценки которые учитывают тип статистической модели. Для параметрической и не параметрической моделей эти способы могут быть различны. Рассмотрим некоторые свойства, которые характеризуют качество введенной оценки. Определение 2.3.
Оценка Определение 2.4.
Оценка Определение 2.5.
Оценка Определение 2.6.
Несмещенная оценка Вообще говоря, дисперсии несмещенных оценок могут зависеть о параметра Ө. В этом случае под эффективной оценкой понимается такая, для которой вышеприведенное неравенство является строгим хотя бы для одного значения параметра Ө. 3.Интервальные оценки. Пусть имеется параметрическая статистическая модель (SӨ
,
FZn
(
zn
,Ө
)), Ө
Определение 3.1. Интервал [θ1 (Zn ),θ2 (Zn )] со случайными концами, «накрывающий» с вероятностью 1-α, 0<α<1, неизвестный параметр θ, т.е. P{ θ1 (Zn )≤ θ ≤ θ2 (Zn )}= 1-α, называется доверительным интервалом (или интервальной оценкой ) уровня надежности 1-α параметра θ. Аналогично определяется доверительный интервал для произвольной функции от параметра θ. Определение 3.2. Число δ=1-α называется доверительной вероятностью или уровнем доверия (надежности). Определение 3.3. Доверительный интервал [θ1 (Zn ),θ2 (Zn )] называется центральным , если выполняются следующие условия: P{ θ≥ θ2
(Zn
)}= Часто вместо двусторонних доверительных интервалов рассматривают односторонние доверительные интервалы, полагая θ1 (Zn )= -∞ или θ2 (Zn )= +∞. Определение 3.4. Интервал, границы которого удовлетворяют условию: P{ θ≥ θ2 (Zn )}= α (или P{ θ1 (Zn ) ≥ θ}= α.), называется соответственно правосторонним ( или левосторонним) доверительным интервалом. 4.Проверка статистических гипотез. Определение 4.1. Статистической гипотезой H или просто гипотезой называется любое предположение относительно параметров ли законов распределения СВ X, проверяемое по выборке Zn . Определение 4.2. Проверяемая гипотеза называется основной ( или нулевой ) и обозначается Ho. Гипотеза, конкурирующая с Ho , называется альтернативной и обозначается H1 , Определение 4.3. Статистическая гипотеза Ho называется простой, если она однозначно определяет параметр или распределение СВ X. В противном случае гипотеза Ho называется сложной. Определение 4.4. Статистическим критерием (критерием согласия, критерием значимости или решающим правилом) проверки гипотезы Ho называется правило, в соответствии с которым по реализации z=φ(zn ) статистики Z гипотеза Ho принимается или отвергается. Определение 4.5.
Критической областью
Определение 4.6 . Доверительной областью G статистического критерия называется область значений z статистики Z, при которых гипотеза Ho принимается. Например, в качестве статистического критерия можно использовать правило:
При реализации этого правила возникают ошибки двух видов. Определение 4.7 . Ошибкой 1-го рода называется событие, состоящее в том, что гипотеза Ho отвергается, когда она верна. Определение 4.8 . Ошибкой 2-го рода называется событие, состоящее в том, что принимается гипотеза Ho , когда верна гипотеза H1 . Определение 4.9
. Уровнем значимости
статистического критерия называется вероятность ошибки 1-го рода α=P{Z Вероятность ошибки 2-го рода равна β=P{Z Ясно. Что с уменьшением вероятности α ошибки 1-го рода возрастает вероятность β ошибки 2-го рода, и наоборот, т.е. при выборе критической и доверительной областей должен достигаться определенный компромисс. Поэтому часто при фиксированной вероятности ошибки 1-го рода критическая область выбирается таким образом, чобы вероятность ошибки второго рода была минимальна. Определение 4.10. Мощность статистического критерия – это вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза. Проверка статистической гипотезы может быть подразделена на следующие этапы:
Теория к лабораторной работе №3. Определение 1 .Упорядочим элементы реализации выборки х1 ,…,хn по возрастанию: x(1) ≤x(2) ≤…≤x(n) , где верхний индекс соответствует номеру элемента в упорядоченной последовательности. Обозначим через x(k)
, k= Определение 2. Элементы x( k) вариационного ряда называются порядковыми статистиками , а крайние члены вариационного ряда x(1) , x( n) – экстремальными порядковыми статистиками. Определение 3
. Рассмотримпроцедуру группировки выборки. Для этого действительную ось IR1=(-∞,∞) разделим точками αо,…,αl+1
на l+1 непересекающихся полуинтервал (разряд) ∆k=[αk
, αk+1
), k= Последовательность пар (
Определение 4.
На оси OX отложим разряды и на них, как на основании, постоим прямоугольники с высотой, равной Определение 5. Случайная величина X распределена равномерно на отрезке [a,b] (X~R(a;b)), если плотность вероятности имеет вид:
Определение 6. Случайная величина X имеет экспоненциальное (показательное) распределение с параметром λ>0, т.е. X~E(λ), если плотность вероятности имеет вид: Определение 7 . Случайная величина X имеет нормальное (гауссовское) распределение с параметрами m и σ2 >0, т.е. X~N(m; σ2 ), если При этом случайная величина называется нормальной (гауссовской). График плотности нормального распределения, называемый кривой Гаусса, имеет единственный максимум в точке x=m. Критерий согласия (критерий Пирсона). Как бы хорошо ни была подобрана теоретическая кривая, между нею и статистическим распределением неизбежны некоторые расхождения. Для выяснения их пользуются «критериями согласия». Одним из наиболее применяемых- является так называемый «критерий Расчетная часть. 1.Построение оценок Суть метода наименьших квадратов состоит в том, что S(a,b)=
1.1 Составим систему нормальных уравнений:
1.2 Построение оценки
67,3532+14,35а=0 ã = - 4,6936 1.3 Построение оценки
163,835+41b=0 b= - 3,99598 2.Построение оценки
n - m=41-2=39 S2
= S2 = 17329,02;
3. Построение интервальных оценок коэффициентов a , b и дисперсии s 2 на уровне доверия 0,9 и 0,95.
где Квантили распределения а). б). I.1.Построим интервальные оценки дисперсии s2 на уровне доверия g=0,95: a=1-g=0,05,
2.Построим интервальные оценки дисперсии s2 на уровне доверия g=0,9: a=1-g=0,1, Далее, где cii обозначает (i,i)-ый элемент матрицы А-1 , а символ t(n-m) – распределение Стьюдента с n-m степенями свободы. Отсюда
где Квантили распределения Стьюдента для интервалов a,b: а). б).
С11 =0,02439 (для свободного члена,b), С22 =0,069686 (для a). n=41, m=2. II.1. Построим интервальную оценку для коэффициента b на уровне доверия g=0,95:
2. Построим интервальную оценку для коэффициента b на уровне доверия g=0,9:
III. 1. Построим интервальную оценку для коэффициента a на уровне доверия g=0,95:
2. Построим интервальную оценку для коэффициента a на уровне доверия g=0,9:
4.Проверка гипотез с помощью критерия Снедекера-Фишера. Ho - разные гипотезы, H1 - альтернативная гипотеза. Существует область принятия гипотезы и область отклонения гипотезы. y(x)=ax+b МНК: Необходимо проверить следующие гипотезы:
Критерий Снедекера-Фишера:
D=17329,02; n=41. Квантили распределения Фишера для критерия Снедекера-Фишера а). б). 1. y=b: а). На уровне доверия б). На уровне доверия 2. y=ax: а). На уровне доверия б), На уровне доверия Приложение Сводная таблица оценок
Интервальные оценки
-15,951 -14,042 4,655 6,563
-10,656 -9,527 1,535 2,664
298,159 317,556 674,543 732,728 Список использованной литературы. 1.Кочетков Е.С. Метод наименьших квадратов: Учебное пособие. Москва, издательствр МАИ, 1993г. 2.М.В.Болдин, Е.Р. Горяинова, А.Р. Панков, С.С Тарасова. Теория вероятностей и математическая статистика: лабораторные работы. Москва, издательство МАИ, 1992г. 3.Кибзун А.И., Горяинова Е.Р., Наумов А.В. Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами. Учебное пособие, 2-е издание, исправленное и дополненное. Москва, ФИЗМАТЛИТ, 2005г. |