Асимптотично нормальні оцінки і надійні інтервали

Лекція 13. Асимптотично нормальні оцінки і надійні інтервали

Оцінка називається асимптотично нормальною оцінкою праметра , якщо існує число b> 0, що при великих обсягах вибірки оцінка має розподіл близький до нормального з параметрами : при великих n.

Приклад 1. Відносна частота як оцінка ймовірності є асимптотично нормальною.

Доведення. k – має розподіл Бернуллі. . Із ЦГТ випливає, що при великих n розподіл k близький до нормального, отже, розподіл також близький до нормального, а саме, і b треба взяти : .

Приклад 2. , як оцінка МХ, якщо DХ скінченна є асимптотично нормальною, також випливає з центральної граничної теореми, і тоді

Приклад 3.Оцінка з відомим мат. сподіванням а, також випливає із ЦГТ, і .

Вправа. Довести формули для b у прикладах 2, 3.

На жаль, оцінкиідля дисперсії з невідомим математичним сподіванням не є асимптотично нормальними.

Надійні інтервали

Раніше розглянуті оцінки параметрів називають ще точковими оцінками:. Розглянемо інтервальні оцінки – надійні інтервали.

Надійний інтервал параметра – це інтервал () з випадковими (залежними від вибірки кінцями), який містить невідомий параметр з ймовірністю не меншою заданого числа . Це число називають надійністю інтервалу:, де , – функції від вибірки. вибирають близьке до 1: 0,9; 0,99; 0,95.

Точність надійного інтервалу – це половина його довжини. Чим точніший інтервал з надійністю , тим кращим він вважається.

Але в деяких випадках найкращими вважаються нескінченні надійні інтервали , , вони називаються однобічними, а скінченні – двобічними.

Методика побудови надійних інтервалів

Часто буває відомий розподіл точкової оцінки(чи деякої функції ), і цей розподіл пов'язаний з невідомим числом (наприклад, як для асимптотично нормальної оцінки). Тоді будують інтервал для розподілу – , такий, що – називатимемо його теж надійним інтервалом для розподілу. Потім внутрішню нерівність розв'язують відносно числа і отримують , тобто – шуканий надійний інтервал для параметра.

Роль функції оцінки може грати будь-яка статистика (функція вибірки), для якої відомий розподіл і він пов'язаний з параметром .

Отже, треба навчитись будувати надійні інтервали для випадкової величини Х з відомим розподілом.

Нехай Х – розподіл з відомою функцією розподілу F(t), чи щільністю розподілу f(t). Потрібно побудувати інтервал , такий, щоб .

Згадаємо, що

З малюнків:, , ; S=

Отже, двобічний інтервал надійності має вигляд , де

будь- які додатні числа, для яких .

Розглянемо однобічні інтервали:

. Отже, правобічний інтервал надійності має вигляд . Аналогічно для лівобічного інтервалу : .

Отже, лівобічний інтервал надійності має вигляд .

Розглянемо особливості надійних інтервалів для стандартного нормального розподілу N(0;1). Так як, нормальний розподіл Y дуже поширений, і він виражається через стандартний:і навпаки , то для побудови надійного інтервалу для нормального розподілу можна побудувати його для стандартного нормального, а потім розв'язати нерівність.

Для стандартного нормального розподілу N(0;1) квантилі позначаються.

., де – таблична функція Лапласа (нагадаємо, що її табличні значення лежать в проміжку [0; 0,5] ).

..

Оскільки, – непарна функція, то отримуємо, що .

Отже, двобічний інтервал надійності для розподілу N(0;1) має вигляд , або , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи .

Цей надійний інтервал буде найточнішим (найкоротшим), коли . Це видно із симетрії щільності N(0;1). : . .

Отже, найточніший надійний інтервал надійності для розподілу N(0;1) має вигляд , де квантиль=t знаходять з табл.ф.Лапласа навпаки, прирівнюючи

Однобічні інтервали: i чи .

Надійні інтервали із асимптотично нормальних оцінок
Із асимптотично нормальних оцінокпри великих обсягах вибірки n можна побудувати надійний інтервал для, оскільки ми знаємо їх розподіл, який пов'язаний з числом .

, то і інтервал надійності для останньої в.в. має вигляд , тобто, . Зробимо прості перетворення у внутрішній нерівності, щоб виразити : , тобто для параметра отримали інтервал надійності : , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи .

Найточніший надійний інтервал: , де квантиль =t знаходять в таблиці Лапласа навпаки, прирівнюючи .

Однобічні інтервали (i):,.

Приклади надійних інтервалів

1. Для MX, якщо DX<+.

– aсимптотична нормальна оцінка, b=, при відомій , або

, чи, якщо - невідома, а вибірка велика .

Маємо найточніший надійний інтервал надійності :

  1. Аналогічно для ймовірності події:при n>500:

.

Якщо , то можна брати максимально можливе b=0,5 (легко довести, що , де 0<p<1).

3. Надійні інтервали для параметрів нормального розподілу

Надійні інтервали для параметрів нормального розподілу можна використовувати при довільних обсягах вибірок, не обов’язково великих. Нормальний розподіл позначаємо і його параметри .

а) Для а при відомому . – тобто, – не тільки асимптотично нормальна оцінка, а, навіть, просто нормальна оцінка, така, що завжди має нормальний розподіл, навіть при малих n.

Співставимо з . – найточніший інтервал надійностідля а.

б) Для дисперсії при відомому а. , тоді має розподіл із n ступенями вільності. Квантилірозподілу із n ступенями вільності позначаються, для них складені таблиці.

Тоді, правобічний інтервал надійності має вигляд для даного розподілу, тобто, ,.=, де , і надійний інтервал для має вигляд:[) –це однобічний інтервал.

Аналогічно інший однобічний інтервал: [).

Для двобічного беруть :

- розподіл не симетричний, то найточніші інтервали шукають методом підбору.

в) Для при невідомому а. Можна довести, що статистика має розподіл із n-1 ступенями вільності.

Тоді маємо такі інтервали:[),[),.

г) Надійні інтервали для а при невідомому . Можна довести, що має t-розподіл Стьюдента із n-1 ступенями вільності. Маємо надійні інтервали: (враховано, що розподіл Стьюдента симетричний відносно точки 0, з модою 0, як і стандартний нормальний розподіл).

При n>120 заміняють квантилі розподілу Стьюдента t на квантилі стандартного нормального розподілу u.

Приклад. Побудувати інтервал надійності 0,92 для середнього значення тривалості роботи кінескопа, якщо спостереження за роботою 400 телевізорів дали такі результати: =10 років 218 днів,

= 613 днів.

Тривалість роботи кінескопа – нормальний розподіл, бо на нього впливають багато незалежних факторів (ЦГТ). Але n=400 – дуже велике, то використаємо все ж таки квантилі стандартного нормального розподілу u.

: =0,46. Маємо з таблиці Лапласа навпаки t=1,75 і найточніший надійний інтервал: . Після обрахунків: (10р.164д.; 10р.272д.).


y

1 y=F(t)

e1

g

e2

t1 t2 t

y y=f(t)

S

S 2 S 1

t1 t2 t

y y=F(t)

1

g

c g t

y y=f(t)

S

c g t

y y=F(t)

1

g

c 1-g t

y y=f(t)

S

c 1-g t

y y=j(t)

S

- u e2 u e1 t

y y=F(t)=F(t)+1/2

1

e1 {

g {

e2 {

- u e2 u e1 t

Асимптотично нормальні оцінки і надійні інтервали