Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона

Федеральное агентство по образованию РФ

Сибирская государственная автомобильно-дорожная академия (СибАДИ)

Кафедра: «Высшая математика»


РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА

Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»


Выполнила: студентка 23ЭУТ

Хасянова А.Ф.

Проверил: Матвеева С.В

Дата_______________

Оценка_____________


Омск-2010

Содержание


1. Введение. Исходные данные

2. Вариационный ряд

3. Интервальный вариационный ряд

4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х

5. Оценки числовых характеристик и параметров выдвинутого закона

6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»

7. Проверка критерия Пирсона

Вывод


1. Исходные данные варианта №20


Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.


Таблица 1

79,02 79,70 74,68 20,47 11,70 44,64 40,75 8,59 96,42 6,17
91,75 93,29 77,57 81,25 76,59 51,84 6,17 42,79 80,87 92,81
48,04 14,70 100,64 69,83 94,56 70,42 47,93 47,48 66,79 42,12
20,27 51,36 62,51 66,86 87,99 99,29 5,96 60,38 62,53 75,50
46,55 83,53 55,65 59,26 77,05 101,10 29,93 102,21 86,11 45,92
90,93 24,30 9,76 90,25 36,72 84,96 20,50 81,99 56,29 31,75
43,61 68,70 80,47 100,66 29,98 48,88 40,37 67,46 91,46 59,11
90,75 4,64 36,53 32,39 6,99 8,41 30,85 37,30 64,44 25,60
18,00 84,27 98,88 36,39 34,64 49,49 10,53 50,97 39,40 3,59
100,39 18,57 9,27 10,89 65,91 35,62 75,45 37,86 89,74 4,57

Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.


2. Построение вариационного ряда


Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.

Проранжировав статистические данные, получаем вариационный ряд (табл. 2).


Таблица 2

3,59 9,76 24,30 36,53 44,64 51,84 66,68 77,05 84,96 93,29
4,57 10,53 25,60 36,72 45,92 55,65 66,79 77,75 86,11 94,56
4,64 10,89 29,93 37,30 46,55 56,29 67,46 79,02 87,99 96,42
5,96 11,70 29,98 37,86 47,48 59,11 68,78 79,70 89,74 98,88
6,17 14,70 30,85 39,40 47,93 59,26 69,83 80,47 90,25 99,29
6,17 18,00 31,75 40,37 48,04 60,38 70,42 80,87 90,75 100,39
6,99 18,57 32,39 40,75 48,88 62,51 74,68 81,25 90,93 100,46
8,41 20,27 34,64 42,12 49,49 62,53 75,45 81,99 91,46 100,66
8,59 20,47 35,62 42,79 50,97 64,44 75,50 83,53 91,75 101,10
9,27 20,50 36,39 43,61 51,36 65,71 76,59 84,27 92,81 102,21

3. Построение интервального вариационного ряда


Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.

Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.

Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,

т.е. – число (частота) попаданий значений X в i-й разряд, n – объем выборки.

Т.к. согласно теореме Бернулли имеем, что т.е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:

Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.

Для построения интервального вариационного ряда выполняем следующие действия.

Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .

Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К– число частичных интервалов . ,

∆=10

Определяем начало первого частичного интервала

После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).


Таблица 3


Разряды

mi

=

1 [3.5-13.5) 14 0.14 0.014 8.5
2 [13.5-23.5) 6 0.06 0.006 18.5
3 [23.5-33.5) 7 0.07 0.007 28.5
4 [33.5-43.5) 12 0.12 0.012 38.5
5 [43.5-53.5) 12 0.12 0.012 48.5
6 [53.5-63.5) 7 0.07 0.007 58.5
7 [63.5-73.5) 8 0.08 0.008 68.5
8 [73.5-83.5) 12 0.12 0.012 78.5
9 [83.5-93.5) 13 0.13 0.013 88.5
10 [93.5-103.5) 9 0.09 0.009 98.5
Контроль

=100

=1



Где -плотность относительной частоты

-середина частичных интервалов


Построение гистограммы


Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).

По данным таблицы 4 строим гистограмму (рис. 1).



Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы равна единице.

Выдвижение гипотезы о законе распределения генеральной совокупности

По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.

По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.


Оценка числовых характеристик и параметров закона распределения


Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.

Оценка называется точечной, если она определяется числом или точкой на числовой оси.

Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.

При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:



где n - объем выборки, – i-й элемент выборки

Составим таблицу для нахождения и



Таблица 4

i

1

8.5*14=119
2

18.5*6=111
3

28.5*7=199.5
4

38.5*12=462
5

48.5*12=582
6

58.5*7=409.5
7

68.5*8=548
8

78.5*12=942
9

88.5*13=1150.5
10

98.5*9=886.5


6. Равномерный закон

интервальный вариационный генеральный совокупность

Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону

найдем функцию плотности равномерного закона вычислив оценки параметров и

,

Т.к М(x)= , , D(x)=


Таблица 5

i

1

2

3

4

5

6

7

8

9

10


186


После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности


Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона


В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.

Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда. При увеличении ч2, и находится по формуле:


К = или К =


Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.


Таблица 6

i

/

1 0.14 14 0.1029 10.29

13.76/10.37=1.33
2 0.06 6 0.1 10

16/10=1.6
3 0.07 7 0.1 10

16/10=1.6
4 0.12 12 0.1 10

16/10=1.6
5 0.12 12 0.1 10

16/10=1.6
6 0.07 7 0.1 10

16/10=1.6
7 0.08 8 0.1 10

16/10=1.6
8 0.12 12 0.1 10