Курсовая работа: Статистические методы обработки экспериментальных данных
Название: Статистические методы обработки экспериментальных данных Раздел: Рефераты по математике Тип: курсовая работа | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Министерство образования Российской Федерации Московский государственный университет печати Факультет полиграфической технологии Дисциплина: Математика Курсовая работа по теме: «Статистические методы обработки Экспериментальных данных» Выполнил: студент Курс 2 Группа ЗТПМ форма обучения заочная Номер зачетной книжки Мз 023 н Вариант № 13 Допущено к защите Дата защиты Результат защиты Подпись преподавателя Москва – 2010 год
1. Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот. i – порядковый номер; Ii – интервал разбиения; xi – середина интервала Ii ; ni – частота (количество результатов наблюдений, принадлежащих данному интервалу Ii ); wi
= Hi
=
Объём выборки: n = wi = ni /100; контроль: Длина интервала разбиения (шаг): h = 3 , Hi
= å : 100 1,00 Статистическим распределением называется соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами. Интервальное распределение – это наборы троек (Ii ; ni ; wi ) для всех номеров i, а точечное – наборы троек (xi ; ni ; wi ). Таким образом, в таблице имеются оба – и интервальное, и точечное - статистическое распределения. Далее, строим полигон и гистограмму относительных частот. Полигон. Полигон относительных частот – ломаная, отрезки которой последовательно (в порядке возрастания xi ) соединяют точки (xi ; wi ). Гистограмма относительных частот – фигура, которая строится следующим образом: на каждом интервале Ii , как на основании, строится прямоугольник, площадь которого равна относительной частоте wi ; отсюда следует, что высота этого прямоугольника равна Hi = wi /h– плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.2. Нахождение точечных оценок математического ожидания и дисперсии. В качестве точечных оценок числовых характеристик изучаемой случайной величины используются: - для математического ожидания
- для дисперсии s2
= где n – объём выборки, ni – частота значения xi . Таким образом, в статистических расчетах используют приближенные равенства MX» Нахождение точечных оценок математического ожидания и дисперсии по данным варианта осуществим с помощью расчетной таблицы.
хi ni /100 = 1590/100= 15,9 s2
= = 5324,04/99=53,78 å : 100 1590 5324,04 3.Выдвижение гипотезы о распределении случайной величины. При выдвижении гипотезы (предположения) о законе распределения изучаемой случайной величины мы опираемся лишь на внешний вид статистического распределения. Т.е. будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей. Итак, изобразим график и выпишем формулу плотности нормального (или гауссовского) распределения с параметрами а и
Сравнение построенной гистограммы и графика плотности распределения приводит к следующему заключению о предполагаемом (теоретическом) законе распределения в рассматриваемом варианте исходных данных: Вариант 13 – нормальное (или гауссовское распределение) 4.Построение графика теоретической плотности распределения. Чтобы выписать плотность теоретического (предполагаемого) распределения, нужно определить значения параметров MX = а, DX = σ2 Поскольку значения математического ожидания и дисперсии неизвестны, то их заменяют соответствующими точечными оценками, т.е. используют (уже упомянутые ранее) приближенные равенства MX» По исходным данным была выдвинута гипотеза о нормальном распределении изучаемой случайной величины. Найдем параметры этого распределения: _
Следовательно, плотность предполагаемого распределения задается формулой F(x)= [1/(7,33*√2π)]*e[-( x-15,9)2 / 2*(7,33)2)] =0.054*e^(0,009/((x-15,9)^2)) Теперь необходимо вычислить значения f(xi )плотности f (x) при x=xi (в серединах интервалов) Для этого воспользуемся следующей схемой:
значения фунцкии
при u=ui находятся, например, с помощью таблицы, имеющейся в любом учебнике или задачнике по теории вероятностей и математической статистике.
Далее, на одном чертеже строим гистограмму и график теоретической плотности распределения: гистограмма была построена ранее, а для получения графика плотности наносим точки с координатами (xi ; f(xi )) и соединяем их плавной кривой.
5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона. Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко: 1) Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным. 2) Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений. Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion – средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо. Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием c2 («хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.) Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма. Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах. Группировка исходных данных. Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через nI количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что ånI = n. Отметим, что критерий c2 будет давать удовлетворительный для практических приложений результат, если: 1) количество n опытов достаточно велико, по крайней мере n³100; 2) в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. ni ³5 при любом i; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты. Пусть концами построенного разбиения являются точки zi , где z1 <z2 < … <zi – 1 , т.е. само разбиение имеет вид (- ¥ºz0 ; z1 ) , [z1 ; z2 ) , [z2 ; z3 ) , … , [zi – 1 ; zi º+¥). После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - ¥, а самой правой на + ¥ (поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:
Вычисление теоретических частот. Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты nI
определяются по фактическим результатам наблюдений. Теоретические частоты, обозначаемые далее
где n – количество испытаний, а pi ºR(zi –1 <x<zi ) - теоретическая вероятность попадания значений случайной величины в i-й промежуток (1 £i£ 1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.
Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице: _ n = 1 0 0; а=x = 15,9 ; σ = s=7,33
å:
1,0000
1
0
0
,00
Статистика c2 и вычисление ее значения по опытным данным. Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения. В критерии Пирсона в качестве такой меры расхождения используется величина
называемая статистикой «хи - квадрат»
или статистикой Пирсона
(вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что всегда c2
³0, причем c2
= 0, тогда и только тогда, когда Прежде чем рассказать о применении статистики c2 к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через c2 набл. .
c 2 набл. = 0,85 5.4. Распределение статистики c2 . Случайная величина имеет c2 – распределение с r степенями свободы (r = 1; 2; 3; …), если ее плотность имеет вид где cr
– которая положительная постоянная ( cr
определяется из равенства Для дальнейшего изложения важно лишь отметить, что, во – первых, распределение Вернемся теперь к статистике
Если в качестве предполагаемого выбрано одно их трех основных непрерывных распределений (нормальное, показательное или равномерное), то r = i – 3, где i – количество промежутков, на которые разбита числовая ось (количество групп опытных данных). В общем случае где Т.е. в данном варианте после группировки исходных данных получаем количество промежутков разбиения i = 10, Следовательно R=i-Nпар -1=10-2-1=7 5.5. Правило проверки гипотезы о законе распределения случайной величины. Ранее отмечалось (и этот факт очевиден), что статистика Если выдвинутая гипотеза о законе распределения изучаемой случайной величины соответствует действительности, то эмпирические и теоретические частоты должны быть примерно одинаковы, а значит, значения статистики Поэтому хотелось бы найти тот рубеж – называемый критическим значением
(или критической точкой) и обозначаемый через Область принятия Критическая областьгипотезы
0 Как же найти критическое значение Если выдвинутая гипотеза о законе распределения изучаемой случайной величины верна, то вероятность попадания значений статистики называется уровнем значимости. Чтобы определить критическое значение с неизвестной x. Поскольку распределение статистики и приближенное значение Геометрические соображения показывают, что последнее уравнение имеет единственное решение: его корень – это такое число x>0, при котором площадь под графиком функции Зададим уровень значимости как Подводя итоги, сформулируем правило проверки гипотезы
о законе распределения случайной величины с помощью 1) Проводят n независимых наблюдений случайной величины (принято считать, что должно быть n³ 100). 2) Разбивают всю числовую ось на несколько (как правило, на 8…12) промежутков так, чтобы количество измерений в каждом из них (называемое эмпирической частотой 3) Выдвигают (например, судя по профилю гистограммы) гипотезу о законе распределения изучаемой случайной величины и находят параметры этого закона (чаще всего, заменяя математическое ожидание и дисперсию их оценками). 4) С помощью предполагаемого (теоретического) распределения находят теоретические вероятности pi
и теоретические частоты 5) По эмпирическим и теоретическим частотам вычисляют значения статистики 6) Определяют число r степеней свободы. 7) Используя заданное значение уровня значимости 8) Формулируя вывод, опираясь на основной принцип проверки статистических гипотез : если наблюдаемое значение критерия принадлежит критической области, т.е. если если наблюдаемое значение критерия принадлежит области принятия гипотезы, т.е. 5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в варианте. Правило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины для данного варианта реализовано в таблице:
Замечания: 1. Заданное значение уровня значимости
т.е. вероятность события { 2. Иногда вместо уровня значимости т.е. { противоположны, то |