Распределение Пуассона. Аксиомы простейшего потока событий

alt="Распределение Пуассона. Аксиомы простейшего потока событий" width="128" height="29" align="BOTTOM" border="0" />случайной выборки

являются независимыми случайными величинами и распре­деленными так же, как и сама генеральная совокупность X. Следовательно,


1.4 Критерии согласия


Пусть (X1,..,Xn) - выборка с неизвестным законом распределения F(X). Рассмотрим гипотезы Н0: F(x)=F0(x) при конкурирующей Н1: F(x)№F0(x). F0(x)- некоторая заданная функция распределения.

Задача проверки гипотез относительно законов распределения называется задачей проверки согласия, а критерий для этой задачи - –ритерием согласия.

Рассмотрим критерий согласия c2, или критерий Пирсона.

Разобьем ось х на т интервалов Если истинная функция распределения F(x) совпадает с F0(x), то при больших n

Рассмотрим случайную величину (ni - –лучайное)

при она стремится к c2 - –аспределению случайной величины с т-е-1 степенями свободы (е- число статистических параметров).

Решающее правило для уровня значимости a:

При построении c2n должно выполняться условие niі10, в противном случае объединяют интервалы.

В случае применения гипотезы Н0 говорят, что различие между F(x) и F0(x) является случайным с доверительной вероятностью 1-a и обусловлено конечностью выборки.


1.5 Теорема Чебышева


Неравенство Чебышева. Для любой случайной величины Х, имеющей математическое ожидание МХ и дисперсию DX, справедливо неравенство

где a — любое положительное число.

Доказательство. Доказательство проведём сначала для непрерывной случайной величины Х с плотностью распределения f(x).

Обозначим через А событие, состоящее в том, что случайная точка Х попадает за пределы участка (MX-a; MX+a), то есть

А: {|X-MX|іa}


a a



MX -a MX MX+a


Вероятность попадания Х в этот участок равна

Найдём дисперсию случайной величины Х

Совершенно аналогично доказывается неравенство Чебышева и для дискретной случайной величины, имеющей значения x1, x2, ... с вероятностями p1, p2, ... Тогда вместо интеграла во всех формулах ставится знак суммы, где суммирование ведётся по тем xi , для которых

|xi-MX|іa,

что и требовалось доказать.


Определение. Пусть имеется последовательность чисел

x1, x2, ... , xn , ...

Говорят, что эта последовательность сходится по вероятности к неслучайной величине а, если при неограниченном увеличении п вероятность события

{|Хп-а|< e},

(где e>0 - произвольное малое фиксированное число) стремится к единице, то есть

Иными словами, каковы бы ни были произвольно малые наперёд заданные числа e>0 и d>0 всегда существует N, такое, что при n>N

P{|Xn-a|<e}>1-d

Первая теорема Чебышева (Закон больших чисел). Пусть имеется случайная величина Х с медианой МХ и дисперсией DX. Над этой случайной величиной Х производится п независимых опытов, в результате которых она принимает значения Х1, Х2, ... , Хп (п “экземпляров” случайной величины Х). Пусть

Тогда последовательность сходится по вероятности к MX:


Доказательство. Найдём MYn и DYn :

Применим к случайной величине Yn неравенство Чебышева, в котором положим a равным e, где e>0 — сколь угодно малое, наперёд заданное число.

Как бы ни было мало e, всегда можно выбрать n таким большим, чтобы правая часть последнего неравенства стала меньше сколь угодно малого положительного числа d; следовательно, при достаточно большом п

P{|Yn-MX|іe}<d

ЮP{|Yn-MX|<e}>1-d,

а это равносильно сходимости по вероятности Yn к MX

Замечание 1.5.1. Первую теорему Чебышева можно записать и иначе, если положить Zn:=Yn-MX

Замечание 1.5.2. Первая теорема Чебышева относится к случаю, когда случайные величины Х1, Х2, ... , Хп независимы и имеют одно и то же распределение, а значит одно и то же MX и DX.

Рассмотрим случай, когда условия производимых опытов меняются.


Вторая теорема Чебышева. Пусть имеется случайная величина Х. Над ней производятся независимые опыты, в результате чего мы получаем последовательность

Х1, Х2, ..., Хn, ...

с различными, в общем случае, MХi и DXi (i=). Пусть

Если DXiЈD i=1, 2, ... , где D - некоторое положительное число, то


Доказательство.

(1.5.1)

Согласно неравенства Чебышева

или, учитывая (1.5.1), имеем

Как бы ни было мало произвольное наперёд заданное e, всегда можно выбрать n таким большим, чтобы правая часть последнего неравенства стала меньше произвольно малого d. Следовательно

,

что и требовалось доказать.

Замечание 1.5.3. При формулировке второй теоремы Чебышева нельзя говорить, что

так как зависят от n, а понятие “сходимость по вероятности” определено нами только для постоянной а, не зависящей от n.


1.6 Понятие доверительного интервала

Будем считать, что независимая выборка взята из распределения, зависящего от скалярного параметра . Будем обозначать через распределение вероятностей, соответствующее значению неизвестного параметра.

Определение 1.6.1  

-доверительным интервалом называется интервал вида     где такой, что

Число называют доверительной вероятностью.

Другими словами, доверительный интервал обладает тем свойством, что, во-первых, его границы вычисляются исключительно по выборке (и, следовательно, не зависят от неизвестного параметра), и, во-вторых, он накрывает неизвестный параметр с вероятностью .

Значение доверительной вероятности выбирается заранее, этот выбор определяется конкретными практическими приложениями.
Смысл величины -- вероятность допустимой ошибки. Часто берут значения и т.п.

Ниже мы приводим один из методов построения доверительных интервалов. Он состоит из трех этапов.

Выбираем функцию , зависящую от выборки и от неизвестного параметра, такую, что ее функция распределения

не зависит от неизвестного параметра .

Выбираем два числа и таким образом, чтобы . Подбираем и , удовлетворяющие условиям

(6.1)


Таким образом,

(6.2)


причем и не зависят от .

Решим двойное неравенство относительно . В том случае, когда его решением является интервал, обозначим его левый и правый концы через и соответственно. Естественно, они зависят от выборки: , . В силу (6.2)

Следовательно, -- искомый -доверительный интервал.

Замечание 1.6.1  

Описанная процедура, разумеется, не является универсальной. Во-первых, вопрос о выборе функции  решается в каждом конкретном случае и по этому поводу нет общих рекомендаций. Во-вторых, совершенно не гарантировано, что решением неравенства в п. 3 будет интервал конечной длины. Вместе с тем, во многих важных случаях изложенный выше метод приводит к хорошим доверительным интервалам. Например, оправдано применение такого метода в случае, когда при каждой фиксированной выборке функция является строго монотонной и непрерывной по переменной .

Замечание 1.6.2  

В силу неоднозначности выбора функции и чисел  и  , можно заключить, что -доверительный интервал неединственен.


1.7 Сравнение средних


Теперь рассмотрим случай, когда обе совокупности подчиняются нормальному распределению, но проверка гипотез о равенстве двух генеральных дисперсий закончилась отвержением гипотезы равенства. Такую задачу сравнения двух генеральных средних при неравных генеральных дисперсиях принято называть проблемой Беренса-Фишера (по имени учёного У. Беренса опубликовавшего первую работу на эту тему в 1929 г.). В этом случае вместо одной общей генеральной дисперсии мы имеем дело с двумя неравными генеральными дисперсиями:  σ12 ≠ σ22. Соответственно имеем и две выборочные дисперсии  s12 и s22. Тогда искомая t-статистика будет вычисляться по следующему выражению [1.7.1]:

             (1.7.1)

Введём обозначения: θ= σ12 / σ22  , u = s12 / s22 и N= n1/ n2 .   В этом случае выражение (1.7.1) можно переписать в следующем виде [(1.7.1)]:

 (1.7.2).

Основная сложность этого случая заключается в том, что  подкоренное выражение в знаменателе не имеет Хи-квадрат распределение, и потому статистика t не имеет распределения Стьюдента. В 40-60-е годы 20 века Бокс, Уэлч, Саттерзвайт, Кохрэн, Боно, Шеффе и многие другие статистики провели детальный анализ этой проблемы. Так в 1938 г. Уэлч исследовал приближённое распределение статистики (1.7.1) и показал, что при  равных объёмах выборок n1 =  n2 незнание величины θ= σ12 / σ22  не очень сильно влияет на итоговый результат. Однако для случая неравных объёмов выборок ошибки становятся весьма значительными. Другие подходы позволяли аппроксимировать статистику (1.7.2) распределение Стьюдента с дробными степенями свободы.

1.8 Метод минимума X2.

Метод минимума X2 применим лишь и случае группированного непрерывною рас­пределения или дискретного распределения. Оценки, получаемые этим методом, при больших п асимптотически эквивалентны оценкам, полу­ченным с помощью более простого видоизмененного метода миниму­ма X2, выражаемого уравнениями

(1.8.1)

или

(1.8.2)

в рассматриваемых случаях последний метод совладает с методом максимума правдоподобия.

Основная теорема о предельном распределении X2 для случая, когда некоторые параметры оцениваются по выборке что оценки находятся с помощью видоизмененного метода минимума X2. Однако там же было указано, что имеется целый класс методов нахождения оценок, приводящих к тому же самому пре­дельному распределению для X2. Теперь мы докажем это утверждение.

Асимптотические выражения для оценок, получаемых с помощью видоизмененного метода минимума X2 были приведены в явной форме

(1.8.3)

для общего случая у неизвестных параметров а1,...,аг. Предположим, что выполнены условия 1)—3) предыдущего параграфа или аналогичные условия для дискретного распределения. Тогда из предыдущего параграфа следует, что оценки (1.8.3)асимптотически нормальны (это уже было показано в параграфе 30.3) и асимптотически эффективны.

Во всех множествах асимптотически нормальных и асимптотически эффективных оценок для параметров имеются члены порядка n-1/2 та­кие же, как и в (1.8.3). Однако из вывода предельного распреде­ления для у2 следует, что это предельное распределение полностью определяется членами порядка n-1/2 в (1.8.3). Действительно, по формулам и

получаем и показывает,что предельное распределение для .у = (, .... ) определяется именно указанными членами.

Таким образом, теорема о предельном распреде­лении величины X2 справедлива для любого множества асимптоти­чески нормальных и асимптотически-эффективных оценок пара­метров.


1.9  Распределение Пуассона. Аксиомы простейшего потока событий

Говорят, что случайная величина Х имеет распределение Пуассона, если её возможные значения 0, 1, 2, ... , т, ... (бесконечное, но чёткое множество значений), а соответствующие вероятности выражаются формулой:


x 0 1 k

P

e-l le-l


Число l называется параметром распределения.

Простейший поток событий – такая последовательность событий, происходящих в случайный момент времени.

Поток событий называется пуассоновским, если он удовлетворяет аксиомам простейшего потока событий:

При таких допущениях с большой степенью точности выполняются следующие условия:

Отсутствие последействия: вероятность того, что на произвольном временном промежутке (с точки зрения длины и расположения на временной оси) не зависит от того, что происходило в момент времени, предшествующему этому моменту.

Однородность потока: Вероятность того, что на некотором временном промежутке произойдет 0,1,2,…,n событий зависит только от его длины и не зависит от положення этого отрезка на временной оси.

Пусть Dt - длина временного промежутка, тогда: (Dt)=l Dt+o(Dt), Dt®0.

(Dt)=1-l Dt+o(Dt), Dt®0.

Математическое ожидание распределения Пуассона равно:


M=

2 ПРАКТИЧЕСКАЯ ЧАСТЬ


Вариант 23


Задача 1


На отрезок единичной длины наугад ставится точка. Вычислить вероятность того, что расстояние от точки до концов отрезка превышает величину .

Решить задачу при , .

Решение:

Пусть дан отрезок длины (Рис. 2.1). Расстояние от точки до концов отрезка превышает величину в том случае, если , где , .

Рис. 2.1


Пусть А – событие, когда . Тогда искомая вероятность .

Для заданных значений и .

Задача 2


В круг радиуса R наудачу ставится точка. Найти вероятность того, что она попадет в одну из двух непересекающихся фигур, которые имеют площади и .

Решить задачу при , , .

Решение:

Поскольку фигуры не пересекаются, то площадь, в которую должна попасть точка, равна . Общая площадь, в которую может попасть точка, равна . Таким образом искомая вероятность . Для заданных значений , и .


Задача 3


Среди лотерейных билетов выигрышных. Наудачу взяли билетов. Определить вероятность того, что среди них не менее L выиграшных.

Решить задачу при