<< Пред. стр. 3 (из 19) След. >>
Ряд распределения можно изобразить графически (рис. 4.1).Рис. 4.1
Если на рис. 4.1 по оси абсцисс отложить значения случайной величины, по оси ординат - вероятности значений, полученные точки соединить отрезками прямой, то получим многоугольник распределения вероятностей (полигон распределения).
Дискретная случайная величина может быть задана функцией распределения.
Функцией распределения случайной величины Х называется функция F(x), выражающая вероятность того, что Х примет значение, меньшее чем х:
Здесь для каждого значения х суммируются вероятности тех значений xi, которые лежат левее точки х.
Функция F(x) есть неубывающая функция. Для дискретных случайных величин функция распределения F(x) есть разрывная ступенчатая функция, непрерывная слева (рис. 4.2).
Вероятность попадания случайной величины Х в промежуток от ? до ? (включая ?) выражается формулой
Р(????Х < ?) = F(?) - F(?). (4.3)
Одной из важных числовых характеристик случайной величины Х является математическое ожидание
М(Х) = x1p1, + x2p2 +...+ x3p3. (4.4)
В случае бесконечного множества значений xi в правой части (4.4) находится ряд, и мы будем рассматривать только те значения Х, для которых он абсолютно сходится.
М(Х) представляет собой среднее ожидаемое значение случайной величины. Оно обладает следующими свойствами:
1) М(С) = С, где С = const;
2) М(СХ) = СМ(Х);
3) М(Х + Y) = М(Х) + М(Y), для любых Х и Y;
4) М(ХУ) = М(Х)М(У), если Х и Y независимы.
(4.5)
Для оценки степени рассеяния значений случайной величины около ее среднего значения М(Х) = а вводятся понятия дисперсии D(X) и среднего квадратического (стандартного) отклонения ?(х). Дисперсией называется математическое ожидание квадрата разности (Х - а),
где а = М(Х); ? (х) определяется как квадратный корень из дисперсии, т. е.
Для вычисления дисперсии пользуются формулой
D(X) = М(Х2) - М2(Х). (4.6)
Свойства дисперсии и среднего квадратического отклонения:
1) D(C) = 0, где С = const;
если Х и У независимы.
Размерность величин М(Х) и ?(Х) совпадает с размерностью самой случайной величины X, а размерность D(X) равна квадрату размерности случайной величины X.
4.2. Математические операции над случайными величинами
Пусть случайная величина Х принимает значения хi с вероятностями Р(Х = xi) =pi(i= 1, 2, ..., п), а случайная величина Y - значения уj с вероятностями Р(Y = у) =pj(j = 1, 2, ..., m). Произведение КХ случайной величины Х на постоянную величину K - это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные произведениям на К значений случайной величины X. Следовательно, закон ее распределения имеет вид табл. 4.2.
Таблица 4.2
kxi
kx1
kx2
...
kxn
pi
p1
p2
...
pn
Квадрат случайной величины (X 2) - это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные квадратам ее значений.
Сумма случайных величин Х и Y - это новая случайная величина, принимающая все значения вида xi + уj, (i = 1, 2, .... п; j = 1, 2, ..., т) с вероятностями рij, выражающими вероятность того, что случайная величина Х примет значение xi ,a Y - значение yj, т. е.
рij = Р(Х = xi; У = уj) = Р(Х = xi)РX=xi(Y = уi). (4.8) Если случайные величины Х и Y независимы, то
Аналогично определяются разность и произведение случайных величин Х и Y. .
Разность случайных величин Х и Y - это новая случайная величина, которая принимает все значения вида хi - уj, а произведение - все значения вида хiуj с вероятностями, определяемыми по формуле (4.8), а если случайные величины Х и Y независимы, то по (4.9).
4.3. Распределения Бернулли и Пуассона
Рассмотрим последовательность п идентичных повторных испытаний, удовлетворяющих следующим условиям:
1) каждое испытание имеет 2 исхода, называемые успех и неуспех; это - взаимно несовместные и противоположные события;
2) вероятность успеха - р - остается постоянной от испытания к испытанию. Вероятность неуспеха - q;
3) все п испытаний - независимы. Это значит, что вероятность наступления события в любом из п повторных испытаний не зависит от результатов других испытаний.
Вероятность того, что в п независимых повторных испытаниях, в каждом из которых вероятность появления события равна р(0 < р < 1), событие наступит ровно т раз (в любой последовательности), равна
где q = 1- р.
Выражение (4.10) называется формулой Бернулли.
Вероятности того, что событие наступит: а) менее т раз; б) более т раз; в) не менее т раз; г) не более т раз - находятся по формулам:
Биномиальным называют закон распределения дискретной случайной величины Х - числа появлений события в n независимых испытаниях, в каждом из которых вероятность наступления события равна р; вероятности возможных значений Х = О, 1, 2, ..., т, ..., п вычисляются по формуле Бернулли (табл.4.3).
Таблица 4.3
Так как правая часть формулы (4.10) представляет общий член биномиального разложения (q + р)n, то этот закон распределения называют биномиальным. Для случайной величины X, распределенной по биномиальному закону, имеем
М(Х) = np; (4.11)
D(X) = npq. (4.12)
Если число испытаний велико, а вероятность появления события р в каждом испытании очень мала, то вместо формулы (4.10) пользуются приближенной формулой
где т - число появлений события в п независимых испытаниях; ? = пр ( среднее число появлений события в п испытаниях).
Выражение (4.13) называется формулой Пуассона. Придавая т целые неотрицательные значения т = 0, 1, 2, ..., п, можно записать ряд распределения вероятностей, вычисленных по формуле (4.13), который называется законом распределения Пуассона (табл. 4.4).
Таблица 4.4
Распределение Пуассона (приложение 3) часто используется, когда мы имеем дело с числом событий, появляющихся в промежутке времени или пространства, например: число машин, прибывших на автомойку в течение часа; число дефектов на новом отрезке шоссе длиной в 10 км; число мест утечки воды на 100 км водопровода; число остановок станков в неделю; число дорожных происшествий.
Если распределение Пуассона применяется вместо биномиального, то п должно иметь порядок не менее нескольких десятков, лучше нескольких сотен, а пр < 10.
Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона, совпадают и равны параметру ?, который определяет этот закон, т. е.
М(Х) = D(X) = ?. (4.14)
4.4. Гипергеометрическое распределение
Пусть имеется множество N элементов, из которых М элементов обладают некоторым признаком А. Извлекается случайным образом без возвращения п элементов. Требуется найти вероятность того, что из них т элементов обладают признаком А. Искомая вероятность (зависящая от N, М, п, т) определяется по формуле
Полученный с помощью формулы (4.15) ряд распределения называется гипергеометрическим законом распределения (табл. 4.5).
Таблица 4.5
Математическое ожидание и дисперсия случайной величины т, распределенной по гипергеометрическому закону, определяются формулами:
Пример 1. Известно, что в определенном городе 20% горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 человека.
1) Составьте ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте его график.
2) Найдите числовые характеристики этого распределения.
3) Напишите функцию распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте ее график.
4) Чему равна вероятность того, что среди 4 случайно отобранных человек: а) не будет ни одного человека, предпочитающего добираться на работу личным автотранспортом; б) окажется хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом; в) будет не больше 2, предпочитающих добираться на работу личным автотранспортом?
Решение. В качестве случайной величины в данной задаче выступает число людей в выборке, предпочитающих добираться на работу личным автотранспортом. Обозначим ее через X. Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4.
Вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, постоянна и равна 0,2 (р = 0,2). Вероятность противоположного события, т. е. того, что каждый из отобранных людей предпочитает добираться на работу не личным автотранспортом, а как-то иначе, также постоянна и составляет 0,8 (q= 1 - p= 10,2=0,8).
Все 4 испытания - независимы, т. е. вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, не зависит от того, каким способом предпочитает добираться на работу любой другой человек из числа случайно отобранных.
Очевидно, что случайная величина Х подчиняется биномиальному закону распределения вероятностей с параметрами n=4 и р = 0,2.
Итак, по условию задачи:
n = 4; р = 0,2; q = 0,8; X = т.
1) Чтобы построить ряд распределения, необходимо вычислить вероятности того, что случайная величина примет каждое из своих возможных значений, и записать полученные результаты в таблицу.
Расчет искомых вероятностей осуществляется по формуле Бернулли
Поставим в эту формулу данные задачи.
Получим ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом (табл. 4.6).
Таблица 4.6
X
0
1
2
3
4
P
0,4096
0,4096
0,1536
0,0256
0,0016
Так как все возможные значения случайной величины образуют полную группу событий, то сумма их вероятностей должна быть равна 1.
Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + + 0,0016 = 1.
Вместо ряда распределения дискретная случайная величина может быть задана графически многоугольником (полигоном) распределения (рис. 4.3).
Рис. 4.3
2) Найдем основные числовые характеристики распределения данной случайной величины: математическое ожидание, дисперсию и среднее квадратическое (стандартное) отклонение.
Математическое ожидание любой дискретной случайной величины может быть рассчитано по формуле (4.4)
Но, ввиду того, что в данном случае речь идет о математическом ожидании частоты, для его расчета можно воспользоваться более простой формулой (4.11)
М(Х = т) = nр = 4 · 0,2 = 0,8 (чел.).
Рассчитаем дисперсию числа человек, предпочитающих добираться на работу личным автотранспортом, среди 4 отобранных. Дисперсия любой дискретной случайной величины может быть рассчитана по формуле
В данном случае речь идет о дисперсии частоты, а ее можно найти по формуле (4.12)
D(X = т) = npq = 4 · 0,2 · 0,8 = 0,64 (чел.2).
Рассчитаем среднее квадратическое отклонение числа людей в выборке, предпочитающих добираться на работу личным автотранспортом. Среднее квадратическое отклонение рассчитывается по формуле
3) Дискретную случайную величину можно задать функцией распределения
где для каждого значения х суммируются вероятности тех значений хi, которые лежат левее точки х.
Зададим функцию распределения дискретной случайной величины применительно к условию данной задачи
Для построения графика функции распределения вероятностей дискретной случайной величины необходимо рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям случайной величины. Алгоритм их расчета вытекает из смысла функции распределения
F(Xi) = Р(Х1) + Р(Х2) + ... + Р(Хi-2) + Р(Хi-1).
Эта формула справедлива для всех F(Xi), кроме F(X0). Так как функция распределения определяет вероятность того, что случайная величина примет значение, меньшее заданного, понятно, что вероятность того, что случайная величина примет значение, не более минимального, равна 0, т. е. F(X0) = 0.
Рассчитаем значения F(x)
Эти данные можно представить и в виде табл. 4.7.
Таблица 4.7
Х х ??0 0 < х ?1 1 < x ?2 2< x??3 3 < x?? 4 х > 4 F(x) 0 0,4096 0,8192 0,9728 0,9984 1
График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми случайная величина принимает возможные значения (рис. 4.4).
4) Определим вероятность того, что среди 4 случайно отобранных человек:
а) Не будет ни одного человека, предпочитающего добираться на работу личным автотранспортом.
Р(Х = 0) = 0,4096.
Вероятность того, что среди четырех случайно отобранных человек не будет ни одного, предпочитающего добираться на работу личным автотранспортом, составляет 0,4096.
б) Будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом.
"Хотя бы 1" - "как минимум 1" - "1 или больше". Другими словами, "хотя бы 1" - это "или 1, или 2, или 3, или 4".
Исходя из этого, для определения вероятности того, что среди 4 случайно отобранных человек будет хотя бы 1, предпочитающий добираться на работу личным автотранспортом, можно использовать теорему сложения вероятностей несовместных событий:
Р(Х ?? 1) = Р(Х = 1) + Р(Х = 2) + Р(Х = 3) + Р(Х = 4);
Р(Х ?? 1) = 0,4096 + 0,1536 + 0,0256 + 0,0016 = 0,5904.
С другой стороны, все возможные значения случайной величины образуют полную группу событий, а сумма их вероятностей равна 1. По отношению к событию (X ? 1) до полной группы событий не хватает события (X = 0), которое является противоположным событию (X ? 1). Поэтому искомую вероятность того, среди 4 случайно отобранных человек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом, проще найти следующим образом:
Р(Х ?? 1) + Р(Х < 1) = 1, откуда Р(Х ?? 1)=1 - Р(Х = 0) = 1 - 0,4096 = 0,5904.
Вероятность того, что среди 4 случайно отобранных человек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом, составляет 0,5904.
в) Будет не больше 2, предпочитающих добираться на работу личным автотранспортом.
"Не больше 2" - "2 или меньше", т. е. "или 0, или 1, или 2".
Используем теорему сложения вероятностей несовместных событий
Р(Х ? 2) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);
Р(Х ? 2) = 0,4096 + 0,4096 + 0,1536 = 0,9728.
Вероятность того, что среди 4 случайно отобранных человек будет не больше 2, предпочитающих добираться на работу личным автотранспортом, составляет 0,9728.
Пример 2. Среднее число инкассаторов, прибывающих утром на автомобиле в банк в 15-минутный интервал, равно 2. Прибытие инкассаторов происходит случайно и независимо друг от друга.
1) Составьте ряд распределения числа инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин.
2) Найдите числовые характеристики этого распределения.
3) Напишите функцию распределения числа инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин, и постройте ее график.
4) Определите, чему равна вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора.
5) Определите вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.
Решение. Пусть случайная величина Х - число инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин. Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4, 5, ..., п.
Это - дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных значений является счетным.
По условию, прибытие инкассаторов происходит случайно и независимо друг от друга. Следовательно, мы имеем дело с независимыми испытаниями.
Если мы предположим, что вероятность прибытия инкассаторов на автомобиле одинакова в любые 2 периода времени равной длины и что прибытие или неприбытие автомобиля в любой период времени не зависит от прибытия или неприбытия в любой другой период времени, то последовательность прибытия инкассаторов в банк может быть описана распределением Пуассона.
Итак, случайная величина Х - число инкассаторов, прибывающих утром на автомобиле в течение 15 мин, подчиняется распределению Пуассона. По условию задачи: ? = пр = 2; Х = т.
1) Составим ряд распределения.
Вычислим вероятности того, что случайная величина примет каждое из своих возможных значений, и запишем полученные результаты в таблицу.
Так как данная случайная величина Х подчинена распределению Пуассона, расчет искомых вероятностей осуществляется по формуле Пуассона (4.13).
Найдем по этой формуле вероятность того, что в течение 15 мин утром на автомобиле прибудет 0 инкассаторов;
Однако расчет вероятностей распределения Пуассона легче осуществлять, пользуясь специальными таблицами вероятностей распределения Пуассона. В этих таблицах содержатся значения вероятностей при заданных m и ? (приложение 6). По условию ? = 2, а т изменяется от 0 до n. Воспользовавшись таблицей распределения Пуассона (приложение 3), получим:
Р(Х = 0) = 0,1353; Р(Х = 1) = 0,2707;
Р(Х = 2) = 0,2707; Р(Х = 3) = 0,1804;
Р(Х = 4) = 0,0902; Р(Х = 5) == 0,0361;
Р(Х = 6) = 0,0120; Р(Х = 7) = 0,0034;
Р(Х = 8) = 0,0009; Р(Х = 9) = 0,0002.
Данных для ?=2 и m ? 10в таблице нет, что указывает на то, что эти вероятности составляют менее 0,0001, т. е.
Р(Х = 10) ? 0.
Понятно, что Р(Х =11) еще меньше отличается от 0.
Занесем полученные результаты в табл. 4.8.
Таблица 4.8
Р
(Х)
,1353
1
0,2707
2
0,2707
3
0,1804
4
0,0902
5
0,0361
6
0,0120
7
0,0034
8
0,0009
9
0,0002
10
0,0000
Так как все возможные значения случайной величины образуют полную группу событий, сумма их вероятностей должна быть равна 1.
Проверим:
-0,1353 + 0,2707 + 0,2707 + 0,1804 + 0,0902 + 0,0361 + + 0,0120 + 0,0034 + 0.0009 + 0,0002 = 0,9999 ?1.
График полученного ряда распределения дискретной случайной величины Х - полигон распределения вероятностей (рис. 4.5).
Рис. 4.5
2) Найдем основные числовые характеристики полученного распределения случайной величины X.
Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по общим для любой дискретной случайной величины формулам.
Математическое ожидание случайной величины, подчиняющейся распределению Пуассона, может быть рассчитано и по формуле
М(Х = т) = пр = ?, М(Х = т) = ? = 2 (инкассатора).
Для выполнения дисперсии случайной величины, подчиняющейся распределению Пуассона, можно применить формулу
D(X = т) = ?.
Итак, дисперсия числа инкассаторов, прибывающих утром на автомобиле в течение 15 мин,
D(X = т) = ? = 2 (инкассатора2).
Среднее квадратическое отклонение числа инкассаторов, прибывающих утром на автомобиле в течение 15 мин,
3) Зададим теперь дискретную случайную величину в виде функции распределения
График функции вероятностей дискретной случайной величины - полигон распределения вероятностей (рис. 4.6).
Рассчитаем значения F(x):
Эти данные можно представить и в виде табл. 4.9.
Таблица 4.9
Х
Р(Х)
х ? 0
0
0<х?1
0,1353
1<х?2
0,4060
2<х?3
0,6767
3<х?4
0,8571
4.<х?5
0,9473
5
6<х?7
0,9954
7
8<х?9
0,9997
х>9
1
4) Определим вероятность того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора.
"Хотя бы 2" - "как минимум 2" - "2 или больше". Другими словами, "хотя бы 2" - это "или 2, или 3, или 4, или ...".
Исходя из этого, для определения вероятности того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора, можно использовать теорему сложения вероятностей несовместных событий:
Р(Х???2) = Р(Х=2) + Р(Х=3) + Р(Х=4) + ... + Р(Х=n).
С другой стороны, все возможные значения случайной величины образуют полную группу событий, а сумма их вероятностей равна 1. По отношению к событию (X ? 2) до полной группы событий не хватает события (X < 2), т. е. (х ? 1), которое является противоположным событию (X ? 2). Поэтому искомую вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, проще найти следующим образом:
Р(Х ? 2) = 1 - Р(Х ? 1) = 1 - (Р(Х = 0) + Р(Х = 1)) = = 1 - (0,1353 + 0,2707) = 1 - 0,406 = 0,594.
Вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, составляет 0,594.
5) Определим вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.
"Меньше 3" - это "или 0, или 1, или 2". Из теоремы сложения вероятностей несовместных событий следует:
Р(Х < 3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);
Р(Х < 3) = 0,1353 + 0,2707 + 0,2707 - 0,6767.
Вероятность того, что в течение 15 мин в банк прибудут меньше 3 инкассаторов, составляет 0,6767.
Пример 3. Из 20 лотерейных билетов выигрышными являются 4. Наудачу извлекаются 4 билета.
1) Составьте ряд распределения числа выигрышных билетов среди отобранных.
2) Найдите числовые характеристики этого распределения.
3) Напишите функцию распределения числа выигрышных билетов среди отобранных и постройте
ее график.
4) Определите вероятность того, что среди отобранных 4 билетов окажется: а) не меньше 3 выигрышных билетов; б) не больше 1-го выигрышного билета.
Решение. В качестве случайной величины в данной задаче выступает число выигрышных билетов среди отобранных. Обозначим ее через X.
Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4.
Это - дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее, чем на 1, и множество ее возможных значений является счетным.