Приклади розподілів випадкових величин

Лекція №7

Приклади розподілів випадкових величин

План

  1. Рівномірний розподіл
  2. Стандартний нормальний розподіл
  3. Нормальний розподіл
  4. Властивості нормальних розподілів. Центральна гранична теорема
  5. Розподіли - Пірсона, t-Стьюдента, F-Фішера-Снєдокора
  6. Показниковий розподіл
  7. Біноміальний розподіл
  8. Розподіл Пуассона. Найпростіший потік
  9. Гіпергеометричний розподіл
  10. Геометричний розподіл

Д.з.: 085-116: 518, 523, 528, 531, 533, 534, 549, 550, 552, 584, 585, 586, 589-591, 596-598

Рівномірний розподіл

Рівномірний розподіл на відрізку [a, b] (чи з параметрами a, b) – це абсолютно неперервна випадкова величина з такою щільністю:

f(x)=

Відшукаємо константу з умови

Звідки const=1/(b-a). Отже,

f(x)=

f

1/(b-a)

a b x

Відшукаємо функцію рівномірного розподілу за формулою F(x)=

Якщо x<0, то F(x) = ,

при , F(x)= – рівняння прямої,

при x>b, F(x)=1.

Отже, F(x)= 1 y=F(x)

a b x

Обчислимо числові характеристики рівномірного розподілу.

Із механічного змісту математичного сподівання та дисперсії, якщо Х – рівномірно розподілена на [a;b], то

MX= , DX=.

Вправа. Перевірити формули за означенням.

Оскільки, рівномірний розподіл симетричний, то AsX=0, MeX= .

Неважко підрахувати, що ExX=-1,2 . Немає МоX.

Розглянемо приклади випадкових величин, що мають рівномірний розподіл:

  1. При регулярному русі транспорту час очікування його рівномірно розподілений на відрізку [0, T], де Т – проміжок часу між двома прибуттями транспорту на зупинку.
  2. Момент приходу корабля у порт можна вважати рівномірно розподіленим на протязі доби, якщо корабель плив здалеку.
  3. Іноді розподіл вважають рівномірним на відрізку, якщо відомо, що він зосереджений на відрізку, а жодної іншої інформації про цей розподіл немає.
  4. Похибки заокруглення з точністю до 10 - n - рівномірно розподілені на відрізку

[-0,5*10-n ;0,5*10-n].

  1. Рулетка -- рівномірний розподіл від 0° до 360°.

Стандартний нормальний розподіл

Кажуть, що випадкова величина має стандартний нормальний розподіл, якщо її щільність дорівнює: f(x)=(x)=.

Стандартний нормальний розподіл позначається N(0,1).

(x)

-1 1 х

Відомо що, . Отже, ця функція дійсно є щільністю.

Як ви знаєте, для функції Лапласа Ф(х)= складені таблиці. Функція розподілу N(0,1) пов'язана з функцією Лапласа співвідношенням

F(x)=.

Треба пам’ятати, що функція Лапласа непарна: Ф(-х)=-Ф(х).

Ф

1/2

х

-1/2

F

1

1/2

F

0 x

Тоді P(a<Х<b)=F(b)-F(a)=1/2+Ф(b)-1/2-Ф(а)=Ф(b)-Ф(а).

Обчислимо числові характеристики стандартного нормального розподілу.

З геометричної точки зору, оскільки щільність симетрична відносно нуля то MX=0.

==.

(Тут використано, що.)

Тоді, DX=MX2-(MX)2=1-02=1.

Розподіл одновершинний, симетричний, тому МоХ=0, МеХ=0, АsX=0. Отже, і МХ3=0

Обчислимо m4 = МХ4

==

(Тут аналогічно як при обчисленні MX2 неважко довести, що .)

Тоді

Тут можна пояснити походження формули для ексцесу. Віднімають трійку, щоб порівнювати ексцеси випадкових величин з ексцесом нормального розподілу, а з нулем зручніше порівнювати.

Впрапва. Подумати чи правильно: якщо Х~N(0,1), то і -Х~N(0,1).

Нормальний розподіл N(a, 2) Гауса, Лапласа

Випадкова величина Y називається нормально розподіленою з параметрами a, 2, якщо

Y= a+ X, де X – вип. величина , що має стандартний нормальний розподіл.( .)

Скорочений запис: Y~N(a, 2), якщо Y= a+ X , де Х~N(0,1).

Оскільки при Х~N(0,1), також і -Х~N(0,1), то можна вважати >0.

Знайдемо числові характеристики нормального розподілу, використавши властивості математичного сподівання та дисперсії: МY= a+ МХ=а, DY =D(X)= 2DX= 2, = .

Отже, параметри нормального розподілу – це його математичне сподівання (середнє значення) та дисперсія: a=MX, =.

Знайдемо функцію нормального розподілу Y, врахувавши те, що функція стандартного нормального розподілу Х нам відома Fx(t)=1/2 +Ф(t).

Знайдемо щільність нормального розподілу

=

f

а-3 а- а а+ а+3 t

Нормальний розподіл – симетричний, тому AsY=0, MoY=a, MеY=a, MY=a.

Обчислимо .

Тоді Отже, ExY==0

Таким чином, асиметрія й ексцес будь-якого нормального розподілу a не тільки стандартного дорівнюють нулю.

Обчислимо ймовірність попадання нормального розподілу в заданий проміжок: .

Обчислимо ймовірність відхилення Y від середнього значення не більше ніж на задане число .

Якщо = 3, то Р=2Ф(3)==. То ймовірність протилежної події приблизно дорівнює нулю. Ми отримали правило трьох сігм (), згідно якого ймовірність відхилення нормально розподіленої випадкової величини від свого середнього значення більше ніж на 3 приблизно дорівнює нулю.

Властивості нормальних розподілів

1.Клас нормальних розподілів інваріантний відносно лінійних замін випадкової величини, тобто, якщо Х – нормальний розподіл, то сХ+d – також нормальний, при с (Очевидно, якщо врахувати, що Х= Z+a, де Z~N(0,1). )

2.Якщо Х1,Х2,…,Хn – нормальні розподіли, то Х1+Х2+…+Хn – також нормальний розподіл, якщо не вийде сталий розподіл (без доведення).

Центральна гранична теорема Ляпунова

Нехай Х1,Х2,…,Хn, … – незалежні випадкові величини,

існують їх скінченні моменти: МXk=ak, DXk=dk,

Розглянемо їхню суму, випадкову величину Sn = Х1+Х2+…+Хn. Позначимо: a1+a2+…an=An, (це будуть МSn і Sn відповідно),

Якщо , то при великих n розподіл Sn дуже близький до нормального, тобто, для всіх t є R . (1)

Оцінку швидкості збіжності дає формула:для всіх t є R.

Із центральної граничної теореми випливає поширеність нормального розподілу у природі. На випадкову величину, що зустрічається на практиці іноді впливає велика кількість мало залежних причин, кожна з яких вносить невеликий вклад у цю випадкову величину, тоді, за центральною граничною теоремою її розподіл має бути близьким до нормального.

Із ЦГТ випливає також наближені локальна та інтегральна формули Лапласа.

Приклади нормальних розподілів. Дуже поширений у природі та на практиці: похибки експери-ментів, маса чи розміри виробу, ріст людини, відхилення снаряда від точки прицілювання і т.д.

Для математичної статистики важливою є теорема – ЦГТ для незалежних однаково розподілених величин: якщо випадкові величини – незалежні та однаково розподілені, мають скінченне математичне сподівання та дисперсію, то їх сумарна випадкова величина має розподіл близький до нормального і виконується формула 1.

Доведення., , , , то для їх сумарної випадкової величини , , , =,

i тоді , , тобто виконується умова ЦГТ.

Задача. Середня маса яблук у ящику 25 кг, середнє квадратичне відхилення 2 кг. Яка ймовірність того, що: 1) маса яблук у 100 ящиках буде менша 2450 кг, 2) маса яблук у 100 ящиках відхилиться від середньої маси не більше, ніж на 200 кг?

Позначимо– маса першого ящ.,...,– маса сотого ящика, S – маса 100 ящиків.

Тоді S = , = 25 кг, ==4

MS==2500 кг, DS = (незалежні), =20.

Тоді за ЦГТ розподіл S має бути близький до нормального S~N (2500;400).

2), оскільки Ф(5)=0,4999997.

В статистиці зустрічаються інші розподіли, які будуються з допомогою нормального.

Розподіл - Пірсона

– незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1). Y = .

Тоді кажуть, що Y має розподіл із n ступенями вільності.

Для цього розподілу складені таблиці.

Обчислимо числові характеристики розподілу Пірсона:

МY = ,

DY = = n(3-1) = 2n.

Якщо ступенів вільності багато (n>20), то, згідно з ЦГТ, розподіл Пірсона близький до нормального N(n, 2n). Тому таблиці складені тільки до n=20.

Очевидно, що якщо випадкові величини Y та Z незалежні і мають розподіли з n та m ступенями вільності, то Y+Z також має розподіл з n+m ступенями вільності.

t – розподіл Стьюдента

– незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл ~N (0; 1).

t =X/

Тоді кажуть, що t має t-розподіл Стьюдента із n ступенями вільності. Для цього розподілу складені таблиці.

F – розподіл Фішера-Снєдокора

–незалежні однаково розподілені випадкові величини і мають стандартний нормальний розподіл N (0; 1): F =

Тоді кажуть, що F має F-розподіл із (n,m) ступенями вільності. Для цього розподілу складені таблиці.

Показниковий розподіл

Випадкова величина називається показниково розподіленою з параметром l>0 якщо її функція розподілу має вигляд

0, t<0, 1 y=F(x)

F (t) = 1-, tV0

x

Знайдемо щільність

0, t<0, l y=f(x)

f (t)=F'(t)= , tV0 x

Теорема: показниковий розподіл описує тривалість існування нестаріючих елементів, тобто, якщо елемент проіснував час t, то ймовірність того, що він проіснує ще час така ж як і для нового елемента.

Доведення. Для нового елемента: ==.

Для старого елемента -- використаємо формулу.

====.

Приклади показникових розподілів: нестаріючими є радіоактивні елементи, тривалість телефонної розмови, проміжок часу між двома однотипними послідовними подіями (замовленнями, викликами).

Обчислимо числові характеристики показникового розподілу:

====1/l.

Тут використано, що .

Аналогічно неважко обчислюється . Тоді , .

МоХ = 0. Знайдемо медіану, розв'язавши рівняння F(T)=1/2: 1-=1/2,=1/2, =2,

звідки MeX=ln2/l . Показниковий розподіл має правосторонню асиметрію, оскільки MX>MeX>MoX (1/l > ln2/l > 0 ), AsX=2.

Вправа. Перевірити, що AsX=2.

Приклади дискретних випадкових величин. Біноміальний розподіл (Бернуллі)

Такий розподіл має випадкова величина Х – кількість успіхів у n незалежних випробуваннях, (або якщо розглядається n незалежних подій з однаковими ймовірностями p, то Х – кількість подій, що сталися). Можливі значення: 0, 1, 2, 3, ..., n. Ймовірність кожного значення обчислюється за формулою Бернуллі:,, де p – ймовірність успіху, q – ймовірність промаху(q=1-p). Отже, параметрами біноміального розподілу є два числа n i p.

Х

0

1

...

n

Р

...

(використано формулу бінома Ньютона).

Отже, це справді закон розподілу.

Складені таблиці для біноміального розподілу, а саме дляі дляпри різних n, p,.

Обчислимо числові характеристики біноміального розподілу. Для цього позначимо випадкові величини – кількість успіхів у першому випробуванні, – кількість успіхів у другому випробуванні, ..., – кількість успіхів в n -тому випробуванні. ,,..., – дискретні незалежні випадкові величини з однаковим розподілом (законом розподілу):

0

1

Р

q

p

i=1,2,..., n.

, , =p(1-p)=pq.

Тоді початкова випадкова величина Х= і

MX==np, DX=(незал.)==npq, .

Обчислимо моду.

Теорема. МоХ=[pn+p] , якщо pn+p не є цілим числом ([pn+p] ціла частина числа pn+p).

Доведення. Подивимось, коли більше чи рівне:

V1, що рівносильне ()

p(n-k)Vq(k+1) . Отже, приймовірності зростають, а при спадають.

Тому: 1) Якщо = pn-q ціле число, то =pn-q+1=pn+p також ціле і , тобто i найбільш імовірні значення з однаковими ймовірностями і моди немає.

  1. Якщо ж pn-q не є цілим, то значення k=[pn-q+1]=[np+p] є найбільш імовірним значенням.

Зауваження. Якщо np-ціле, то згідно теореми воно і буде модою, тобто тоді Мо=МХ=np.

Задача. Для кожного з чотирьох працівників ймовірність отримати виклик протягом зміни дорів-нює 0,6. Знайти закон розподілу кількості працівників, що отримають виклик протягом зміни, обчислити її математичне сподівання, дисперсію та середнє квадратичне відхилення.

Х – к-cть працівників, що отримають виклик протягом зміни – біноміальний розподіл з n=4, p=0,6.

Х

0

1

2

3

4

Р

0,0256

0,1536

0,3456

0,1536

0,1296

MX=np==2,4 DX=npq==0,96 .

Оскільки біноміальний розподіл можна представити у вигляді суми n незалежних однакових розподілів (так як при обчисленні числових характеристик), то із ЦГТ для однакових розподілів випливає, що при великих n біноміальний розподіл близький до нормального, а саме до

N(np, npq). Звідси отримуємо наближені локальну та інтегральну формули Лапласа.

Розподіл Пуассона

Такий розподіл має випадкова величина, яка набуває значень 0, 1, 2, 3, ... і

k=0, 1, 2, 3, ..., де – параметр, .

. Отже, це дійсно закон розподілу.

Розподіл Пуассона описує рідкісні події. Він є граничним розподілом для біноміального, якщо p мале, а n велике. (Згадаємо формулу Пуассона.) Складені таблиці для розподілу Пуассона, а саме для i дляпри різних , k і .

Знайдемо числові характеристики розподілу Пуассона :

MX=.

==,

DX=.

Найпростіший потік

Нехай час від часу відбуваються випадкові події певного типу, наприклад, телефонні виклики, автомобільні аварії і т. п. Послідовність моментів настання таких подій називається випадковим потоком.

Означення. Потік називається найпростішим, якщо виконуються умови:

  1. кількості подій, які відбудуться на несумісних інтервалах часу незалежні;
  2. ймовірність настання в нескінченно малий проміжок часу () двох і більше подій можна вважати нулем.

Теорема 1. Якщо потік найпростіший, то кількість подій, що відбудеться в даному інтервалі часу, має розподіл Пуассона (без доведення).

Нехай відомо, що в інтервалі часу довжиною h в середньому відбувається N подій. N може бути не цілим, воно і буде параметром розподілу Пуассона Х – кількості подій в інтервалі часу довжиною h. Тоді в інтервалі часу довжиною kh в середньому відбувається kN подій, і відповідно змінюється параметр (Y – кількість подій в інтервалі часу kh, – кількості подій в послідовних інтервалах часу довжинами h, з яких складається інтервал kh. , то ).

Теорема 2. Якщо потік найпростіший, то інтервали часу між послідовними подіями незалежні, однаково розподілені і мають показниковий розподіл з однаковим параметром (без дов.).

Позначимо цей показниковий розподіл Y. В тій ж ситуації, якщо відомо, що в інтервалі часу довжиною h в середньому відбувається N подій, то середній інтервал між послідовними подіями h/N. Для показникового розподілу середнє значення МY=1/, то =N/h.

Задача. На склад надходить у середньому 2 замовлення за день. Яка ймовірність того, що за наступні три дні: 1)не буде жодного замовлення, 2)буде більше двох замовлень, 3)буде більше 10 замовлень? Знайти середній проміжок часу між двома замовленнями. Потік замовлень вважати найпростішим.

Х – кількість замовлень за 3 дні – розподіл Пуассона.

За 3 дні в середньому буде 6 замовлень (), тобто МХ==6.

1) P(X=0) ==.

2) P(X>2)=1 -.

3) P(X>10) =» (знаходимо в таблицях розподілу Пуассона) » 0,044.

Середній проміжок часу між замовленнями h/N=(1день)/2=1/2 (дня) – половина дня.

Зауваження. Розподіл Пуассона розглядають також і у випадку, коли рідкісні точки розподіляються на площині чи в об'ємі. Наприклад, кількість родзинок в булці.

Гіпергеометричний розподіл

Нехай є сукупність N елементів, з яких М елементів мічені, а решта N-M елементів не мічені. Із сукупності вибирають n елементів. Х – кількість мічених елементів серед вибраних. Такий розподіл називають гіпергеометричним. (Пригадайте задачу про лотерейні білети із лекції 1. Х – кількість виграшних білетів серед куплених.)

З допомогою комбінаторики знаходимо P(X=k)= для всіх можливих значень k, тобто при . Для інших k ця ймовірність очевидно дорівнює нулю.

Можна вважати, що n елементів вибирають послідовно. Позначимо – кількість мічених елементів при виборі першого елемента, – при виборі другого, ..., – при виборі останнього елемента. Ці випадкові величини є рівноправними (дивись задачу про щасливий екзаменаційний білет), тобто, мають однаковий розподіл (закон розподілу), а саме

0

1

Р

1-М/N

M/N

Можна позначити p=M/N, q=1-p.

Х=. Аналогія з біноміальним розподілом, але, на відміну від біноміального розподілу тут випадкові величини є залежними.

Обчислимо числові характеристики гіпергеометричного розподілу:

МХ=М() = =nM/N=np,

Обчислимо окремо:.

Врахувавши симетрію і те, що кількість подвоєних добутків буде обчислюємо далі :

.

DX=(Вправа. Розписати і перевірити.)

Як бачимо, при великих N і малих (набагато менших) n математичне сподівання та дисперсія гіпергеометричного розподілу майже такі ж як у біноміального. Це невипадково. Біноміальний розподіл є граничним до гіпергеометричного при великих N і малих n , тобто, коли те що взяли попередні мічені чи не мічені не сильно впливає на загальний відсоток мічених і на наступний вибір елемента. Справедлива формула: .(Неважко довести, тут n та k фіксовані (сталі). Вправа. Довести.)

Геометричний розподіл

Геометричний розподіл – це розподіл кількості промахів до першого успіху при повторних незалежних випробуваннях. Можливі значення: 0, 1, 2, ... .

Їх ймовірності , де – успіх у і-тому випробуванні, p – ймовірність успіху в одному випробуванні, q=1-p – ймовірність промаху, k=0, 1, 2, ... .

Геометричний розподіл є дискретним аналогом показникового: згадаємо, що показниковим розподілом є час до наступної події при найпростішому потоці подій і співставимо з геометричним розподілом – кількістю випробувань до першого успіху.

Обчислимо числові характеристики геометричного розподілу:

MX==

==(cума геометр.ряду ) =.

==

=

.

DX=.

Вправа: обчислити моду та медіану геометричного розподілу.


=

=

Приклади розподілів випадкових величин