Распределение Пуассона. Аксиомы простейшего потока событий
alt="Распределение Пуассона. Аксиомы простейшего потока событий" width="128" height="29" align="BOTTOM" border="0" />случайной выборкиявляются независимыми случайными величинами и распределенными так же, как и сама генеральная совокупность X. Следовательно,
1.4 Критерии согласия
Пусть (X1,..,Xn) - выборка с неизвестным законом распределения F(X). Рассмотрим гипотезы Н0: F(x)=F0(x) при конкурирующей Н1: F(x)№F0(x). F0(x)- некоторая заданная функция распределения.
Задача проверки гипотез относительно законов распределения называется задачей проверки согласия, а критерий для этой задачи - –ритерием согласия.
Рассмотрим критерий согласия c2, или критерий Пирсона.
Разобьем ось х на т интервалов Если истинная функция распределения F(x) совпадает с F0(x), то при больших n
Рассмотрим случайную величину (ni - –лучайное)
при она стремится к c2 - –аспределению случайной величины с т-е-1 степенями свободы (е- число статистических параметров).
Решающее правило для уровня значимости a:
При построении c2n должно выполняться условие niі10, в противном случае объединяют интервалы.
В случае применения гипотезы Н0 говорят, что различие между F(x) и F0(x) является случайным с доверительной вероятностью 1-a и обусловлено конечностью выборки.
1.5 Теорема Чебышева
Неравенство Чебышева. Для любой случайной величины Х, имеющей математическое ожидание МХ и дисперсию DX, справедливо неравенство
где a — любое положительное число.
Доказательство. Доказательство проведём сначала для непрерывной случайной величины Х с плотностью распределения f(x).
Обозначим через А событие, состоящее в том, что случайная точка Х попадает за пределы участка (MX-a; MX+a), то есть
А: {|X-MX|іa}
a a
MX -a MX MX+a
Вероятность попадания Х в этот участок равна
Найдём дисперсию случайной величины Х
Совершенно аналогично доказывается неравенство Чебышева и для дискретной случайной величины, имеющей значения x1, x2, ... с вероятностями p1, p2, ... Тогда вместо интеграла во всех формулах ставится знак суммы, где суммирование ведётся по тем xi , для которых
|xi-MX|іa,
что и требовалось доказать.
Определение. Пусть имеется последовательность чисел
x1, x2, ... , xn , ...
Говорят, что эта последовательность сходится по вероятности к неслучайной величине а, если при неограниченном увеличении п вероятность события
{|Хп-а|< e},
(где e>0 - произвольное малое фиксированное число) стремится к единице, то есть
Иными словами, каковы бы ни были произвольно малые наперёд заданные числа e>0 и d>0 всегда существует N, такое, что при n>N
P{|Xn-a|<e}>1-d
Первая теорема Чебышева (Закон больших чисел). Пусть имеется случайная величина Х с медианой МХ и дисперсией DX. Над этой случайной величиной Х производится п независимых опытов, в результате которых она принимает значения Х1, Х2, ... , Хп (п “экземпляров” случайной величины Х). Пусть
Тогда последовательность сходится по вероятности к MX:
Доказательство. Найдём MYn и DYn :
Применим к случайной величине Yn неравенство Чебышева, в котором положим a равным e, где e>0 — сколь угодно малое, наперёд заданное число.
Как бы ни было мало e, всегда можно выбрать n таким большим, чтобы правая часть последнего неравенства стала меньше сколь угодно малого положительного числа d; следовательно, при достаточно большом п
P{|Yn-MX|іe}<d
ЮP{|Yn-MX|<e}>1-d,
а это равносильно сходимости по вероятности Yn к MX
Замечание 1.5.1. Первую теорему Чебышева можно записать и иначе, если положить Zn:=Yn-MX
Замечание 1.5.2. Первая теорема Чебышева относится к случаю, когда случайные величины Х1, Х2, ... , Хп независимы и имеют одно и то же распределение, а значит одно и то же MX и DX.
Рассмотрим случай, когда условия производимых опытов меняются.
Вторая теорема Чебышева. Пусть имеется случайная величина Х. Над ней производятся независимые опыты, в результате чего мы получаем последовательность
Х1, Х2, ..., Хn, ...
с различными, в общем случае, MХi и DXi (i=). Пусть
Если DXiЈD i=1, 2, ... , где D - некоторое положительное число, то
Доказательство.
(1.5.1)
Согласно неравенства Чебышева
или, учитывая (1.5.1), имеем
Как бы ни было мало произвольное наперёд заданное e, всегда можно выбрать n таким большим, чтобы правая часть последнего неравенства стала меньше произвольно малого d. Следовательно
,
что и требовалось доказать.
Замечание 1.5.3. При формулировке второй теоремы Чебышева нельзя говорить, что
так как зависят от n, а понятие “сходимость по вероятности” определено нами только для постоянной а, не зависящей от n.
1.6 Понятие доверительного интервала
Будем считать, что независимая выборка взята из распределения, зависящего от скалярного параметра . Будем обозначать через распределение вероятностей, соответствующее значению неизвестного параметра.
Определение 1.6.1
-доверительным интервалом называется интервал вида где такой, что
Число называют доверительной вероятностью.
Другими словами, доверительный интервал обладает тем свойством, что, во-первых, его границы вычисляются исключительно по выборке (и, следовательно, не зависят от неизвестного параметра), и, во-вторых, он накрывает неизвестный параметр с вероятностью .
Значение
доверительной
вероятности
выбирается
заранее, этот
выбор определяется
конкретными
практическими
приложениями.
Смысл величины
--
вероятность
допустимой
ошибки. Часто
берут значения
и т.п.
Ниже мы приводим один из методов построения доверительных интервалов. Он состоит из трех этапов.
Выбираем функцию , зависящую от выборки и от неизвестного параметра, такую, что ее функция распределения
не зависит от неизвестного параметра .
Выбираем два числа и таким образом, чтобы . Подбираем и , удовлетворяющие условиям
|
(6.1) |
Таким образом,
|
(6.2) |
причем
и
не
зависят от
.
Решим двойное неравенство относительно . В том случае, когда его решением является интервал, обозначим его левый и правый концы через и соответственно. Естественно, они зависят от выборки: , . В силу (6.2)
Следовательно, -- искомый -доверительный интервал.
Замечание 1.6.1
Описанная процедура, разумеется, не является универсальной. Во-первых, вопрос о выборе функции решается в каждом конкретном случае и по этому поводу нет общих рекомендаций. Во-вторых, совершенно не гарантировано, что решением неравенства в п. 3 будет интервал конечной длины. Вместе с тем, во многих важных случаях изложенный выше метод приводит к хорошим доверительным интервалам. Например, оправдано применение такого метода в случае, когда при каждой фиксированной выборке функция является строго монотонной и непрерывной по переменной .
Замечание 1.6.2
В силу неоднозначности выбора функции и чисел и , можно заключить, что -доверительный интервал неединственен.
1.7 Сравнение средних
Теперь рассмотрим случай, когда обе совокупности подчиняются нормальному распределению, но проверка гипотез о равенстве двух генеральных дисперсий закончилась отвержением гипотезы равенства. Такую задачу сравнения двух генеральных средних при неравных генеральных дисперсиях принято называть проблемой Беренса-Фишера (по имени учёного У. Беренса опубликовавшего первую работу на эту тему в 1929 г.). В этом случае вместо одной общей генеральной дисперсии мы имеем дело с двумя неравными генеральными дисперсиями: σ12 ≠ σ22. Соответственно имеем и две выборочные дисперсии s12 и s22. Тогда искомая t-статистика будет вычисляться по следующему выражению [1.7.1]:
(1.7.1)
Введём обозначения: θ= σ12 / σ22 , u = s12 / s22 и N= n1/ n2 . В этом случае выражение (1.7.1) можно переписать в следующем виде [(1.7.1)]:
(1.7.2).
Основная сложность этого случая заключается в том, что подкоренное выражение в знаменателе не имеет Хи-квадрат распределение, и потому статистика t не имеет распределения Стьюдента. В 40-60-е годы 20 века Бокс, Уэлч, Саттерзвайт, Кохрэн, Боно, Шеффе и многие другие статистики провели детальный анализ этой проблемы. Так в 1938 г. Уэлч исследовал приближённое распределение статистики (1.7.1) и показал, что при равных объёмах выборок n1 = n2 незнание величины θ= σ12 / σ22 не очень сильно влияет на итоговый результат. Однако для случая неравных объёмов выборок ошибки становятся весьма значительными. Другие подходы позволяли аппроксимировать статистику (1.7.2) распределение Стьюдента с дробными степенями свободы.
1.8 Метод минимума X2.
Метод минимума X2 применим лишь и случае группированного непрерывною распределения или дискретного распределения. Оценки, получаемые этим методом, при больших п асимптотически эквивалентны оценкам, полученным с помощью более простого видоизмененного метода минимума X2, выражаемого уравнениями
(1.8.1)
или
(1.8.2)
в рассматриваемых случаях последний метод совладает с методом максимума правдоподобия.
Основная теорема о предельном распределении X2 для случая, когда некоторые параметры оцениваются по выборке что оценки находятся с помощью видоизмененного метода минимума X2. Однако там же было указано, что имеется целый класс методов нахождения оценок, приводящих к тому же самому предельному распределению для X2. Теперь мы докажем это утверждение.
Асимптотические выражения для оценок, получаемых с помощью видоизмененного метода минимума X2 были приведены в явной форме
(1.8.3)
для общего случая у неизвестных параметров а1,...,аг. Предположим, что выполнены условия 1)—3) предыдущего параграфа или аналогичные условия для дискретного распределения. Тогда из предыдущего параграфа следует, что оценки (1.8.3)асимптотически нормальны (это уже было показано в параграфе 30.3) и асимптотически эффективны.
Во всех множествах асимптотически нормальных и асимптотически эффективных оценок для параметров имеются члены порядка n-1/2 такие же, как и в (1.8.3). Однако из вывода предельного распределения для у2 следует, что это предельное распределение полностью определяется членами порядка n-1/2 в (1.8.3). Действительно, по формулам и
получаем и показывает,что предельное распределение для .у = (, .... ) определяется именно указанными членами.
Таким образом, теорема о предельном распределении величины X2 справедлива для любого множества асимптотически нормальных и асимптотически-эффективных оценок параметров.
1.9 Распределение Пуассона. Аксиомы простейшего потока событий
Говорят, что случайная величина Х имеет распределение Пуассона, если её возможные значения 0, 1, 2, ... , т, ... (бесконечное, но чёткое множество значений), а соответствующие вероятности выражаются формулой:
x | 0 | 1 | … | k | … |
P |
e-l | le-l | … | … |
Число l называется параметром распределения.
Простейший поток событий – такая последовательность событий, происходящих в случайный момент времени.
Поток событий называется пуассоновским, если он удовлетворяет аксиомам простейшего потока событий:
При таких допущениях с большой степенью точности выполняются следующие условия:
Отсутствие последействия: вероятность того, что на произвольном временном промежутке (с точки зрения длины и расположения на временной оси) не зависит от того, что происходило в момент времени, предшествующему этому моменту.
Однородность потока: Вероятность того, что на некотором временном промежутке произойдет 0,1,2,…,n событий зависит только от его длины и не зависит от положення этого отрезка на временной оси.
Пусть Dt - длина временного промежутка, тогда: (Dt)=l Dt+o(Dt), Dt®0.
(Dt)=1-l Dt+o(Dt), Dt®0.
Математическое ожидание распределения Пуассона равно:
M=
2 ПРАКТИЧЕСКАЯ ЧАСТЬ
Вариант 23
Задача 1
На отрезок единичной длины наугад ставится точка. Вычислить вероятность того, что расстояние от точки до концов отрезка превышает величину .
Решить задачу при , .
Решение:
Пусть дан отрезок длины (Рис. 2.1). Расстояние от точки до концов отрезка превышает величину в том случае, если , где , .
Рис. 2.1
Пусть А – событие, когда . Тогда искомая вероятность .
Для заданных значений и .
Задача 2
В круг радиуса R наудачу ставится точка. Найти вероятность того, что она попадет в одну из двух непересекающихся фигур, которые имеют площади и .
Решить задачу при , , .
Решение:
Поскольку фигуры не пересекаются, то площадь, в которую должна попасть точка, равна . Общая площадь, в которую может попасть точка, равна . Таким образом искомая вероятность . Для заданных значений , и .
Задача 3
Среди лотерейных билетов выигрышных. Наудачу взяли билетов. Определить вероятность того, что среди них не менее L выиграшных.
Решить задачу при