Приклади розподілів випадкових величин
Лекція №7
Приклади розподілів випадкових величин
План
- Рівномірний розподіл
- Стандартний нормальний розподіл
- Нормальний розподіл
- Властивості нормальних розподілів. Центральна гранична теорема
- Розподіли - Пірсона, t-Стьюдента, F-Фішера-Снєдокора
- Показниковий розподіл
- Біноміальний розподіл
- Розподіл Пуассона. Найпростіший потік
- Гіпергеометричний розподіл
- Геометричний розподіл
Д.з.: 085-116: 518, 523, 528, 531, 533, 534, 549, 550, 552, 584, 585, 586, 589-591, 596-598
Рівномірний розподіл
Рівномірний розподіл на відрізку [a, b] (чи з параметрами a, b) це абсолютно неперервна випадкова величина з такою щільністю:
f(x)=
Відшукаємо константу з умови
Звідки const=1/(b-a). Отже,
f(x)=
f
1/(b-a)
a b x
Відшукаємо функцію рівномірного розподілу за формулою F(x)=
Якщо x<0, то F(x) = ,
при , F(x)= рівняння прямої,
при x>b, F(x)=1.
Отже, F(x)= 1 y=F(x)
a b x
Обчислимо числові характеристики рівномірного розподілу.
Із механічного змісту математичного сподівання та дисперсії, якщо Х рівномірно розподілена на [a;b], то
MX= , DX=.
Вправа. Перевірити формули за означенням.
Оскільки, рівномірний розподіл симетричний, то AsX=0, MeX= .
Неважко підрахувати, що ExX=-1,2 . Немає МоX.
Розглянемо приклади випадкових величин, що мають рівномірний розподіл:
- При регулярному русі транспорту час очікування його рівномірно розподілений на відрізку [0, T], де Т проміжок часу між двома прибуттями транспорту на зупинку.
- Момент приходу корабля у порт можна вважати рівномірно розподіленим на протязі доби, якщо корабель плив здалеку.
- Іноді розподіл вважають рівномірним на відрізку, якщо відомо, що він зосереджений на відрізку, а жодної іншої інформації про цей розподіл немає.
- Похибки заокруглення з точністю до 10 - n - рівномірно розподілені на відрізку
[-0,5*10-n ;0,5*10-n].
- Рулетка -- рівномірний розподіл від 0° до 360°.
Стандартний нормальний розподіл
Кажуть, що випадкова величина має стандартний нормальний розподіл, якщо її щільність дорівнює: f(x)=(x)=.
Стандартний нормальний розподіл позначається N(0,1).
(x)
-1 1 х
Відомо що, . Отже, ця функція дійсно є щільністю.
Як ви знаєте, для функції Лапласа Ф(х)= складені таблиці. Функція розподілу N(0,1) пов'язана з функцією Лапласа співвідношенням
F(x)=.
Треба памятати, що функція Лапласа непарна: Ф(-х)=-Ф(х).
Ф
1/2
х
-1/2
F
1
1/2
F
0 x
Тоді P(a<Х<b)=F(b)-F(a)=1/2+Ф(b)-1/2-Ф(а)=Ф(b)-Ф(а).
Обчислимо числові характеристики стандартного нормального розподілу.
З геометричної точки зору, оскільки щільність симетрична відносно нуля то MX=0.
==.
(Тут використано, що.)
Тоді, DX=MX2-(MX)2=1-02=1.
Розподіл одновершинний, симетричний, тому МоХ=0, МеХ=0, АsX=0. Отже, і МХ3=0
Обчислимо m4 = МХ4
==
(Тут аналогічно як при обчисленні MX2 неважко довести, що .)
Тоді
Тут можна пояснити походження формули для ексцесу. Віднімають трійку, щоб порівнювати ексцеси випадкових величин з ексцесом нормального розподілу, а з нулем зручніше порівнювати.
Впрапва. Подумати чи правильно: якщо Х~N(0,1), то і -Х~N(0,1).
Нормальний розподіл N(a, 2) Гауса, Лапласа
Випадкова величина Y називається нормально розподіленою з параметрами a, 2, якщо
Y= a+ X, де X вип. величина , що має стандартний нормальний розподіл.( .)
Скорочений запис: Y~N(a, 2), якщо Y= a+ X , де Х~N(0,1).
Оскільки при Х~N(0,1), також і -Х~N(0,1), то можна вважати >0.
Знайдемо числові характеристики нормального розподілу, використавши властивості математичного сподівання та дисперсії: МY= a+ МХ=а, DY =D(X)= 2DX= 2, = .
Отже, параметри нормального розподілу це його математичне сподівання (середнє значення) та дисперсія: a=MX, =.
Знайдемо функцію нормального розподілу Y, врахувавши те, що функція стандартного нормального розподілу Х нам відома Fx(t)=1/2 +Ф(t).
Знайдемо щільність нормального розподілу
=
f
а-3 а- а а+ а+3 t
Нормальний розподіл симетричний, тому AsY=0, MoY=a, MеY=a, MY=a.
Обчислимо .
Тоді Отже, ExY==0
Таким чином, асиметрія й ексцес будь-якого нормального розподілу a не тільки стандартного дорівнюють нулю.
Обчислимо ймовірність попадання нормального розподілу в заданий проміжок: .
Обчислимо ймовірність відхилення Y від середнього значення не більше ніж на задане число .
Якщо = 3, то Р=2Ф(3)==. То ймовірність протилежної події приблизно дорівнює нулю. Ми отримали правило трьох сігм (), згідно якого ймовірність відхилення нормально розподіленої випадкової величини від свого середнього значення більше ніж на 3 приблизно дорівнює нулю.
Властивості нормальних розподілів
1.Клас нормальних розподілів інваріантний відносно лінійних замін випадкової величини, тобто, якщо Х нормальний розподіл, то сХ+d також нормальний, при с (Очевидно, якщо врахувати, що Х= Z+a, де Z~N(0,1). )
2.Якщо Х1,Х2,…,Хn нормальні розподіли, то Х1+Х2+…+Хn також нормальний розподіл, якщо не вийде сталий розподіл (без доведення).
Центральна гранична теорема Ляпунова
Нехай Х1,Х2,…,Хn, … незалежні випадкові величини,
існують їх скінченні моменти: МXk=ak, DXk=dk,
Розглянемо їхню суму, випадкову величину Sn = Х1+Х2+…+Хn. Позначимо: a1+a2+…an=An, (це будуть МSn і Sn відповідно),
Якщо , то при великих n розподіл Sn дуже близький до нормального, тобто, для всіх t є R . (1)
Оцінку швидкості збіжності дає формула:для всіх t є R.
Із центральної граничної теореми випливає поширеність нормального розподілу у природі. На випадкову величину, що зустрічається на практиці іноді впливає велика кількість мало залежних причин, кожна з яких вносить невеликий вклад у цю випадкову величину, тоді, за центральною граничною теоремою її розподіл має бути близьким до нормального.
Із ЦГТ випливає також наближені локальна та інтегральна формули Лапласа.
Приклади нормальних розподілів. Дуже поширений у природі та на практиці: похибки експери-ментів, маса чи розміри виробу, ріст людини, відхилення снаряда від точки прицілювання і т.д.
Для математичної статистики важливою є теорема ЦГТ для незалежних однаково розподілених величин: якщо випадкові величини незалежні та однаково розподілені, мають скінченне математичне сподівання та дисперсію, то їх сумарна випадкова величина має розподіл близький до нормального і виконується формула 1.
Доведення., , , , то для їх сумарної випадкової величини , , , =,
i тоді , , тобто виконується умова ЦГТ.
Задача. Середня маса яблук у ящику 25 кг, середнє квадратичне відхилення 2 кг. Яка ймовірність того, що: 1) маса яблук у 100 ящиках буде менша 2450 кг, 2) маса яблук у 100 ящиках відхилиться від середньої маси не більше, ніж на 200 кг?
Позначимо маса першого ящ.,..., маса сотого ящика, S маса 100 ящиків.
Тоді S = , = 25 кг, ==4
MS==2500 кг, DS = (незалежні), =20.
Тоді за ЦГТ розподіл S має бути близький до нормального S~N (2500;400).
2), оскільки Ф(5)=0,4999997.
В статистиці зустрічаються інші розподіли, які будуються з допомогою нормального.
Розподіл - Пірсона
незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1). Y = .
Тоді кажуть, що Y має розподіл із n ступенями вільності.
Для цього розподілу складені таблиці.
Обчислимо числові характеристики розподілу Пірсона:
МY = ,
DY = = n(3-1) = 2n.
Якщо ступенів вільності багато (n>20), то, згідно з ЦГТ, розподіл Пірсона близький до нормального N(n, 2n). Тому таблиці складені тільки до n=20.
Очевидно, що якщо випадкові величини Y та Z незалежні і мають розподіли з n та m ступенями вільності, то Y+Z також має розподіл з n+m ступенями вільності.
t розподіл Стьюдента
незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1).
t =X/
Тоді кажуть, що t має t-розподіл Стьюдента із n ступенями вільності. Для цього розподілу складені таблиці.
F розподіл Фішера-Снєдокора
незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл N (0; 1): F =
Тоді кажуть, що F має F-розподіл із (n,m) ступенями вільності. Для цього розподілу складені таблиці.
Показниковий розподіл
Випадкова величина називається показниково розподіленою з параметром l>0 якщо її функція розподілу має вигляд
0, t<0, 1 y=F(x)
F (t) = 1-, tV0
x
Знайдемо щільність
0, t<0, l y=f(x)
f (t)=F'(t)= , tV0 x
Теорема: показниковий розподіл описує тривалість існування нестаріючих елементів, тобто, якщо елемент проіснував час t, то ймовірність того, що він проіснує ще час така ж як і для нового елемента.
Доведення. Для нового елемента: ==.
Для старого елемента -- використаємо формулу.
====.
Приклади показникових розподілів: нестаріючими є радіоактивні елементи, тривалість телефонної розмови, проміжок часу між двома однотипними послідовними подіями (замовленнями, викликами).
Обчислимо числові характеристики показникового розподілу:
====1/l.
Тут використано, що .
Аналогічно неважко обчислюється . Тоді , .
МоХ = 0. Знайдемо медіану, розв'язавши рівняння F(T)=1/2: 1-=1/2,=1/2, =2,
звідки MeX=ln2/l . Показниковий розподіл має правосторонню асиметрію, оскільки MX>MeX>MoX (1/l > ln2/l > 0 ), AsX=2.
Вправа. Перевірити, що AsX=2.
Приклади дискретних випадкових величин. Біноміальний розподіл (Бернуллі)
Такий розподіл має випадкова величина Х кількість успіхів у n незалежних випробуваннях, (або якщо розглядається n незалежних подій з однаковими ймовірностями p, то Х кількість подій, що сталися). Можливі значення: 0, 1, 2, 3, ..., n. Ймовірність кожного значення обчислюється за формулою Бернуллі:,, де p ймовірність успіху, q ймовірність промаху(q=1-p). Отже, параметрами біноміального розподілу є два числа n i p.
Х |
0 |
1 |
... |
n |
Р |
... |
(використано формулу бінома Ньютона).
Отже, це справді закон розподілу.
Складені таблиці для біноміального розподілу, а саме дляі дляпри різних n, p,.
Обчислимо числові характеристики біноміального розподілу. Для цього позначимо випадкові величини кількість успіхів у першому випробуванні, кількість успіхів у другому випробуванні, ..., кількість успіхів в n -тому випробуванні. ,,..., дискретні незалежні випадкові величини з однаковим розподілом (законом розподілу):
0 |
1 |
|
Р |
q |
p |
i=1,2,..., n.
, , =p(1-p)=pq.
Тоді початкова випадкова величина Х= і
MX==np, DX=(незал.)==npq, .
Обчислимо моду.
Теорема. МоХ=[pn+p] , якщо pn+p не є цілим числом ([pn+p] ціла частина числа pn+p).
Доведення. Подивимось, коли більше чи рівне:
V1, що рівносильне ()
p(n-k)Vq(k+1) . Отже, приймовірності зростають, а при спадають.
Тому: 1) Якщо = pn-q ціле число, то =pn-q+1=pn+p також ціле і , тобто i найбільш імовірні значення з однаковими ймовірностями і моди немає.
- Якщо ж pn-q не є цілим, то значення k=[pn-q+1]=[np+p] є найбільш імовірним значенням.
Зауваження. Якщо np-ціле, то згідно теореми воно і буде модою, тобто тоді Мо=МХ=np.
Задача. Для кожного з чотирьох працівників ймовірність отримати виклик протягом зміни дорів-нює 0,6. Знайти закон розподілу кількості працівників, що отримають виклик протягом зміни, обчислити її математичне сподівання, дисперсію та середнє квадратичне відхилення.
Х к-cть працівників, що отримають виклик протягом зміни біноміальний розподіл з n=4, p=0,6.
Х |
0 |
1 |
2 |
3 |
4 |
Р |
0,0256 |
0,1536 |
0,3456 |
0,1536 |
0,1296 |
MX=np==2,4 DX=npq==0,96 .
Оскільки біноміальний розподіл можна представити у вигляді суми n незалежних однакових розподілів (так як при обчисленні числових характеристик), то із ЦГТ для однакових розподілів випливає, що при великих n біноміальний розподіл близький до нормального, а саме до
N(np, npq). Звідси отримуємо наближені локальну та інтегральну формули Лапласа.
Розподіл Пуассона
Такий розподіл має випадкова величина, яка набуває значень 0, 1, 2, 3, ... і
k=0, 1, 2, 3, ..., де параметр, .
. Отже, це дійсно закон розподілу.
Розподіл Пуассона описує рідкісні події. Він є граничним розподілом для біноміального, якщо p мале, а n велике. (Згадаємо формулу Пуассона.) Складені таблиці для розподілу Пуассона, а саме для i дляпри різних , k і .
Знайдемо числові характеристики розподілу Пуассона :
MX=.
==,
DX=.
Найпростіший потік
Нехай час від часу відбуваються випадкові події певного типу, наприклад, телефонні виклики, автомобільні аварії і т. п. Послідовність моментів настання таких подій називається випадковим потоком.
Означення. Потік називається найпростішим, якщо виконуються умови:
- кількості подій, які відбудуться на несумісних інтервалах часу незалежні;
- ймовірність настання в нескінченно малий проміжок часу () двох і більше подій можна вважати нулем.
Теорема 1. Якщо потік найпростіший, то кількість подій, що відбудеться в даному інтервалі часу, має розподіл Пуассона (без доведення).
Нехай відомо, що в інтервалі часу довжиною h в середньому відбувається N подій. N може бути не цілим, воно і буде параметром розподілу Пуассона Х кількості подій в інтервалі часу довжиною h. Тоді в інтервалі часу довжиною kh в середньому відбувається kN подій, і відповідно змінюється параметр (Y кількість подій в інтервалі часу kh, кількості подій в послідовних інтервалах часу довжинами h, з яких складається інтервал kh. , то ).
Теорема 2. Якщо потік найпростіший, то інтервали часу між послідовними подіями незалежні, однаково розподілені і мають показниковий розподіл з однаковим параметром (без дов.).
Позначимо цей показниковий розподіл Y. В тій ж ситуації, якщо відомо, що в інтервалі часу довжиною h в середньому відбувається N подій, то середній інтервал між послідовними подіями h/N. Для показникового розподілу середнє значення МY=1/, то =N/h.
Задача. На склад надходить у середньому 2 замовлення за день. Яка ймовірність того, що за наступні три дні: 1)не буде жодного замовлення, 2)буде більше двох замовлень, 3)буде більше 10 замовлень? Знайти середній проміжок часу між двома замовленнями. Потік замовлень вважати найпростішим.
Х кількість замовлень за 3 дні розподіл Пуассона.
За 3 дні в середньому буде 6 замовлень (), тобто МХ==6.
1) P(X=0) ==.
2) P(X>2)=1 -.
3) P(X>10) =» (знаходимо в таблицях розподілу Пуассона) » 0,044.
Середній проміжок часу між замовленнями h/N=(1день)/2=1/2 (дня) половина дня.
Зауваження. Розподіл Пуассона розглядають також і у випадку, коли рідкісні точки розподіляються на площині чи в об'ємі. Наприклад, кількість родзинок в булці.
Гіпергеометричний розподіл
Нехай є сукупність N елементів, з яких М елементів мічені, а решта N-M елементів не мічені. Із сукупності вибирають n елементів. Х кількість мічених елементів серед вибраних. Такий розподіл називають гіпергеометричним. (Пригадайте задачу про лотерейні білети із лекції 1. Х кількість виграшних білетів серед куплених.)
З допомогою комбінаторики знаходимо P(X=k)= для всіх можливих значень k, тобто при . Для інших k ця ймовірність очевидно дорівнює нулю.
Можна вважати, що n елементів вибирають послідовно. Позначимо кількість мічених елементів при виборі першого елемента, при виборі другого, ..., при виборі останнього елемента. Ці випадкові величини є рівноправними (дивись задачу про щасливий екзаменаційний білет), тобто, мають однаковий розподіл (закон розподілу), а саме
0 |
1 |
|
Р |
1-М/N |
M/N |
Можна позначити p=M/N, q=1-p.
Х=. Аналогія з біноміальним розподілом, але, на відміну від біноміального розподілу тут випадкові величини є залежними.
Обчислимо числові характеристики гіпергеометричного розподілу:
МХ=М() = =nM/N=np,
Обчислимо окремо:.
Врахувавши симетрію і те, що кількість подвоєних добутків буде обчислюємо далі :
.
DX=(Вправа. Розписати і перевірити.)
Як бачимо, при великих N і малих (набагато менших) n математичне сподівання та дисперсія гіпергеометричного розподілу майже такі ж як у біноміального. Це невипадково. Біноміальний розподіл є граничним до гіпергеометричного при великих N і малих n , тобто, коли те що взяли попередні мічені чи не мічені не сильно впливає на загальний відсоток мічених і на наступний вибір елемента. Справедлива формула: .(Неважко довести, тут n та k фіксовані (сталі). Вправа. Довести.)
Геометричний розподіл
Геометричний розподіл це розподіл кількості промахів до першого успіху при повторних незалежних випробуваннях. Можливі значення: 0, 1, 2, ... .
Їх ймовірності , де успіх у і-тому випробуванні, p ймовірність успіху в одному випробуванні, q=1-p ймовірність промаху, k=0, 1, 2, ... .
Геометричний розподіл є дискретним аналогом показникового: згадаємо, що показниковим розподілом є час до наступної події при найпростішому потоці подій і співставимо з геометричним розподілом кількістю випробувань до першого успіху.
Обчислимо числові характеристики геометричного розподілу:
MX==
==(cума геометр.ряду ) =.
==
=
.
DX=.
Вправа: обчислити моду та медіану геометричного розподілу.
=
=
Приклади розподілів випадкових величин