Елементи дисперсійного аналізу і теорії кореляції
і теорії кореляції" width="19" height="26" align="BOTTOM" border="0" />,
– ордината
точки, що лежить
на прямій (17) і
має абсцису
,
.
Підставивши
значення
з рівняння (17)
у формулу (18),
одержимо
(19)
Дорівнявши
нулю частинні
похідні
і
функції (19) одержимо
систему двох
лінійних алгебраїчних
рівнянь щодо
параметрів
і
для знаходження
точки її мінімуму
(20)
де
,
,
,
звідкіля остаточно знаходимо
Аналогічно
визначається
вибіркове
рівняння прямої
лінії регресії
на
.
2.5 Знаходження параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за згрупованими даними
При великій
кількості
спостережень
одне й те ж саме
значення
може зустрітися
раз, значення
–
раз, одна й та
ж пара чисел
може спостерігатися
раз. Тому дані
спостережень
групують, тобто
підраховують
відповідні
частоти
,
,
.
Усі згруповані
дані записують
у вигляді таблиці,
що називають
кореляційною.
Приклад такої таблиці приведено нижче (табл. 3).
Таблиця 3
|
|
||||
10 | 20 | 30 | 40 |
|
|
0,4 | 5 | – | 7 | 14 | 26 |
0,6 | – | 2 | 6 | 4 | 12 |
0,8 | 3 | 19 | – | – | 22 |
|
8 | 21 | 13 | 18 |
|
У першому рядку
цієї таблиці
дано перелік
значень (10; 20; 30; 40)
ознаки
,
що спостерігаються,
а в першому
стовпці –
спостерігаємі
значення (0,4; 0,6;
0,8) ознаки
.
На перетинанні
рядків і стовпчиків
знаходяться
частоти
пар значень
ознак. Наприклад,
частота 5 вказує,
що пара чисел
(10; 0,4) спостерігається
5 разів. Риска
означає, що
відповідна
пара чисел,
наприклад (20;
0,4), не спостерігається.
В останньому
стовпчикові
записані суми
частот рядків.
В останньому
рядку записані
суми частот
стовпчиків.
У нижньому
правому куті
таблиці, поміщена
сума всіх частот
(загальна кількість
всіх спостережень
).
У випадку згрупованих даних з урахуванням очевидних співвідношень
,
,
,
систему рівнянь (20) можна переписати у виправленому вигляді
З рішення цієї
системи (
,
)
знаходимо
рівняння прямої
регресії
Шляхом нескладних перетворень його можна переписати у вигляді
де
,
– вибіркові
середні квадратичні
відхилення
величин
і
(21)
– вибірковий коефіцієнт кореляції.
Вибірковий
коефіцієнт
кореляції. Як
відомо з теорії
ймовірностей,
якщо величини
і
незалежні,
коефіцієнт
їхньої кореляції
,
якщо
– величини
і
пов'язані лінійною
функціональною
залежністю.
Тобто коефіцієнт
кореляції
характеризує
ступінь лінійного
зв'язку між
і
.
Вибірковий
коефіцієнт
кореляції
є оцінкою коефіцієнта
кореляції
генеральної
сукупності,
тому він також
характеризує
міру лінійного
зв'язку між
величинами
і
.
3 Поняття про криволінійну кореляцію
Раніше ми обмежилися лінійним наближенням функцій регресії, рівнянь регресії, відповідно і кореляційного зв'язку. Однак теорію можна узагальнити і на наступні наближення.
Нехай дані
спостережень
над кількісними
ознаками
і
зведено до
кореляційної
таблиці. Тим
самим значення
,
що спостерігаються,
розбито на
групи; кожна
група містить
ті значення
,
що відповідають
визначеному
значенню
.
Для приклада
розглянемо
кореляційну
таблицю 4.
Таблиця 4
|
|
|||
10 | 20 | 30 |
|
|
15 | 4 | 28 | 6 | 38 |
25 | 6 | – | 6 | 12 |
|
10 | 28 | 12 |
|
|
21 | 15 | 20 |
До першої групи
відносяться
ті 10 значень
(4 рази спостерігалося
значення
і 6 разів
),
що відповідають
.
До другої групи
– ті 28 значень
(28 разів спостерігалося
і 0 разів
),
що відповідають
.
До третьої
групи відносяться
12 значень
(6 разів спостерігалося
і 6 разів
).
Умовні середні тепер можна назвати груповими середніми: групова середня першої групи
групова середня другої групи
для третьої групи
Оскільки всі
значення ознаки
розбито на
групи, можна
уявити загальну
дисперсію
ознаки у вигляді
суми внутрішньо
групової і
міжгрупової
дисперсій
Можна показати,
що, якщо між
величинами
і
є функціональна
залежність,
то
якщо ж вони пов'язані кореляційною залежністю, то
Вибіркове кореляційне відношення. Для оцінки ступені тісноти лінійного кореляційного зв'язку між ознаками у вибірці застосовується вибірковий коефіцієнт кореляції (21). У разі нелінійного кореляційного зв'язку з тою ж метою вводяться нові узагальнені характеристики:
– вибіркове
кореляційне
відношення
до
;
– вибіркове
кореляційне
відношення
к.
Вони визначаються за формулами:
,
Размещено на