Асимптотично нормальні оцінки і надійні інтервали
Лекція 13. Асимптотично нормальні оцінки і надійні інтервали
Оцінка називається асимптотично нормальною оцінкою праметра , якщо існує число b> 0, що при великих обсягах вибірки оцінка має розподіл близький до нормального з параметрами : при великих n.
Приклад 1. Відносна частота як оцінка ймовірності є асимптотично нормальною.
Доведення. k має розподіл Бернуллі. . Із ЦГТ випливає, що при великих n розподіл k близький до нормального, отже, розподіл також близький до нормального, а саме, і b треба взяти : .
Приклад 2. , як оцінка МХ, якщо DХ скінченна є асимптотично нормальною, також випливає з центральної граничної теореми, і тоді
Приклад 3.Оцінка з відомим мат. сподіванням а, також випливає із ЦГТ, і .
Вправа. Довести формули для b у прикладах 2, 3.
На жаль, оцінкиідля дисперсії з невідомим математичним сподіванням не є асимптотично нормальними.
Надійні інтервали
Раніше розглянуті оцінки параметрів називають ще точковими оцінками:. Розглянемо інтервальні оцінки надійні інтервали.
Надійний інтервал параметра це інтервал () з випадковими (залежними від вибірки кінцями), який містить невідомий параметр з ймовірністю не меншою заданого числа . Це число називають надійністю інтервалу:, де , функції від вибірки. вибирають близьке до 1: 0,9; 0,99; 0,95.
Точність надійного інтервалу це половина його довжини. Чим точніший інтервал з надійністю , тим кращим він вважається.
Але в деяких випадках найкращими вважаються нескінченні надійні інтервали , , вони називаються однобічними, а скінченні двобічними.
Методика побудови надійних інтервалів
Часто буває відомий розподіл точкової оцінки(чи деякої функції ), і цей розподіл пов'язаний з невідомим числом (наприклад, як для асимптотично нормальної оцінки). Тоді будують інтервал для розподілу , такий, що називатимемо його теж надійним інтервалом для розподілу. Потім внутрішню нерівність розв'язують відносно числа і отримують , тобто шуканий надійний інтервал для параметра.
Роль функції оцінки може грати будь-яка статистика (функція вибірки), для якої відомий розподіл і він пов'язаний з параметром .
Отже, треба навчитись будувати надійні інтервали для випадкової величини Х з відомим розподілом.
Нехай Х розподіл з відомою функцією розподілу F(t), чи щільністю розподілу f(t). Потрібно побудувати інтервал , такий, щоб .
Згадаємо, що
З малюнків:, , ; S=
Отже, двобічний інтервал надійності має вигляд , де
будь- які додатні числа, для яких .
Розглянемо однобічні інтервали:
. Отже, правобічний інтервал надійності має вигляд . Аналогічно для лівобічного інтервалу : .
Отже, лівобічний інтервал надійності має вигляд .
Розглянемо особливості надійних інтервалів для стандартного нормального розподілу N(0;1). Так як, нормальний розподіл Y дуже поширений, і він виражається через стандартний:і навпаки , то для побудови надійного інтервалу для нормального розподілу можна побудувати його для стандартного нормального, а потім розв'язати нерівність.
Для стандартного нормального розподілу N(0;1) квантилі позначаються.
., де таблична функція Лапласа (нагадаємо, що її табличні значення лежать в проміжку [0; 0,5] ).
..
Оскільки, непарна функція, то отримуємо, що .
Отже, двобічний інтервал надійності для розподілу N(0;1) має вигляд , або , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи .
Цей надійний інтервал буде найточнішим (найкоротшим), коли . Це видно із симетрії щільності N(0;1). : . .
Отже, найточніший надійний інтервал надійності для розподілу N(0;1) має вигляд , де квантиль=t знаходять з табл.ф.Лапласа навпаки, прирівнюючи
Однобічні інтервали: i чи .
Надійні інтервали із асимптотично нормальних оцінок
Із асимптотично нормальних оцінокпри великих обсягах вибірки n можна побудувати надійний інтервал для, оскільки ми знаємо їх розподіл, який пов'язаний з числом .
, то і інтервал надійності для останньої в.в. має вигляд , тобто, . Зробимо прості перетворення у внутрішній нерівності, щоб виразити : , тобто для параметра отримали інтервал надійності : , де будь- які додатні числа, для яких і квантилі =t шукаємо з допомогою табличної функції Лапласа навпаки, прирівнюючи .
Найточніший надійний інтервал: , де квантиль =t знаходять в таблиці Лапласа навпаки, прирівнюючи .
Однобічні інтервали (i):,.
Приклади надійних інтервалів
1. Для MX, якщо DX<+.
aсимптотична нормальна оцінка, b=, при відомій , або
, чи, якщо - невідома, а вибірка велика .
Маємо найточніший надійний інтервал надійності :
- Аналогічно для ймовірності події:при n>500:
.
Якщо , то можна брати максимально можливе b=0,5 (легко довести, що , де 0<p<1).
3. Надійні інтервали для параметрів нормального розподілу
Надійні інтервали для параметрів нормального розподілу можна використовувати при довільних обсягах вибірок, не обовязково великих. Нормальний розподіл позначаємо і його параметри .
а) Для а при відомому . тобто, не тільки асимптотично нормальна оцінка, а, навіть, просто нормальна оцінка, така, що завжди має нормальний розподіл, навіть при малих n.
Співставимо з . найточніший інтервал надійностідля а.
б) Для дисперсії при відомому а. , тоді має розподіл із n ступенями вільності. Квантилірозподілу із n ступенями вільності позначаються, для них складені таблиці.
Тоді, правобічний інтервал надійності має вигляд для даного розподілу, тобто, ,.=, де , і надійний інтервал для має вигляд:[) це однобічний інтервал.
Аналогічно інший однобічний інтервал: [).
Для двобічного беруть :
- розподіл не симетричний, то найточніші інтервали шукають методом підбору.
в) Для при невідомому а. Можна довести, що статистика має розподіл із n-1 ступенями вільності.
Тоді маємо такі інтервали:[),[),.
г) Надійні інтервали для а при невідомому . Можна довести, що має t-розподіл Стьюдента із n-1 ступенями вільності. Маємо надійні інтервали: (враховано, що розподіл Стьюдента симетричний відносно точки 0, з модою 0, як і стандартний нормальний розподіл).
При n>120 заміняють квантилі розподілу Стьюдента t на квантилі стандартного нормального розподілу u.
Приклад. Побудувати інтервал надійності 0,92 для середнього значення тривалості роботи кінескопа, якщо спостереження за роботою 400 телевізорів дали такі результати: =10 років 218 днів,
= 613 днів.
Тривалість роботи кінескопа нормальний розподіл, бо на нього впливають багато незалежних факторів (ЦГТ). Але n=400 дуже велике, то використаємо все ж таки квантилі стандартного нормального розподілу u.
: =0,46. Маємо з таблиці Лапласа навпаки t=1,75 і найточніший надійний інтервал: . Після обрахунків: (10р.164д.; 10р.272д.).
y
1 y=F(t)
e1
g
e2
t1 t2 t
y y=f(t)
S
S 2 S 1
t1 t2 t
y y=F(t)
1
g
c g t
y y=f(t)
S
c g t
y y=F(t)
1
g
c 1-g t
y y=f(t)
S
c 1-g t
y y=j(t)
S
- u e2 u e1 t
y y=F(t)=F(t)+1/2
1
e1 {
g {
e2 {
- u e2 u e1 t
Асимптотично нормальні оцінки і надійні інтервали