<< Пред. стр. 10 (из 19) След. >>
Легко видеть, что длина доверительного интервала зависит от нескольких факторов. Для заданного уровня значимости ? увеличение вариации вокруг линии регрессии, измеряемой стандартной ошибкой оценки, увеличивает длину интервала. Увеличение объема выборки уменьшит длину интервала. Более того, ширина интервала также варьирует с различными значениями X. Когда оценивается ?yx по значениям X, близким к ?x, то интервал тем уже, чем меньше абсолютное отклонение хi от ?x (рис. 9.5).Когда оценка осуществляется по значениям X, удаленным от среднего ?x, то длина интервала возрастает.
Рассчитаем 95%-й доверительный интервал для среднего значения выручки во всех магазинах с числом посетителей, равным 600. По данным нашего примера уравнение регрессии имеет вид
?yx = 2,423 + 0,00873x:
и для ?xi = 600 получим ?yi; =7,661, а также
По таблице Стьюдента (приложение 5)
t18 = 2,10.
Отсюда, используя формулы (9.31) и (9.32), рассчитаем границы искомого доверительного интервала для ?yx
Итак, 7,369 ? ?yx ?7,953.
Следовательно, наша оценка состоит в том, что средняя дневная выручка находится между 7,369 и 7,953 у. е. для всех магазинов с 600 посетителями.
Для построения доверительного интервала для индивидуальных значений Yx, лежащих на линии регрессии, используется доверительный интервал регрессии вида
где hi ??yi, , Syx ,п и хi - определяются, как и в формулах (9.31) и (9.32).
Определим 95% -и доверительный интервал для оценки дневных продаж отдельного магазина с 600 посетителями
В результате вычислений получим
Итак, 6,577? ?yi ? 8,745.
Следовательно, с 95%-й уверенностью можно утверждать, что ежедневная выручка отдельного магазина, который посетили 600 покупателей, находится в пределах от 6,577 до 8,745 у. е. Длина этого интервала больше чем длина интервала, полученного ранее для оценки среднего значения Y.
9.13. Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии ??1 и коэффициента регрессии р в генеральной совокупности
Построим доверительный интервал для истинного значения генерального параметра ??1. Для этого проверим гипотезу о равенстве нулю ??1. Если гипотеза будет отклонена, то подтверждается существование линейной зависимости Y от X. Сформулируем нулевую и альтернативную гипотезы:
Н0???1 = 0 (линейной зависимости нет);
Н1???1? 0 (линейная зависимость есть).
Для проверки гипотезы Н0 используется t-критерий (случайная величина t, имеющая распределение Стьюдента с п - 2 степенями свободы):
где
Убедимся, что полученный выборочный результат является достаточным для заключения о том, что зависимость объема выручки от числа посетителей магазина статистически существенна на 5%-м уровне значимости.
Следовательно,
Найдем наблюдаемое значение критерия t
tкрит(?=0,05;k=18)= 2,1 (по таблице распределения Стьюдента, приложение 5).
Так как 13,77 > 2,10, то нулевая гипотеза Н0 отвергается в пользу альтернативной гипотезы Н1, и можно говорить о наличии существенной линейной зависимости ежедневной выручки от числа посетителей магазина.
Второй, эквивалентный первому, метод для проверки наличия или отсутствия линейной зависимости переменной Y от Х состоит в построении доверительного интервала для оценки ?1 и определении того, принадлежит ли значение ?1 этому интервалу. Доверительный интервал для оценки ?1 получают по формуле
Найдем для нашего примера 95% -й. доверительный интервал для оценки ?1:
Итак, 0,0074 ???1 ??0,01006,
т. е. с 95%-й уверенностью можно считать, что истинное значение коэффициента регрессии ?1 находится в промежутке между числами 0,0074 и 0,01006. Так как эти значения больше нуля, то можно сделать вывод, что существует статистически значимая линейная зависимость выручки от числа посетителей. Если бы интервал включал нулевое значение, то мы не смогли бы сделать этого вывода.
Третий метод проверки существования линейной связи между двумя переменными состоит в проверке выборочного коэффициента корреляции r.
Для этого выдвигается нулевая гипотеза Н0: ?=0 (нет корреляции).
Альтернативная гипотеза Н1: ???0 (корреляция существует).
Для проверки нулевой гипотезы Н0 используем t-критерий (случайную величину t, имеющую распределение Стьюдента с п - 2 степенями свободы) (9.11).
Наблюдаемое значение t составит
Полученный результат практически совпадает со значением, полученным по формуле (9.35). Следовательно, мы вновь подтверждаем наличие линейной связи между двумя переменными Y и X.
Задачи к теме 9
1. Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлекательность гостиницы в зависимости от ее расстояния до пляжа. С этой целью по 14 гостиницам города была выяснена среднегодовая наполняемость номеров и расстояние в километрах от пляжа.
Расстояние, км 0,1 0,1 0,2 0,3 0,4 0,4 0,5 0,6 0,7 0,7 0,8 0,8 0,9 0,9 Наполняемость,.
% 92 95 96 90 89 86 90 83 85 80 78 76 72 75
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
2. Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей (X) и стоимостью ежемесячного технического обслуживания (Y). Для выяснения характера этой связи было отобрано 15 автомобилей.
Х 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Y 13 16 15 20 19 21 26 24 30 32 30 35 34 40 39
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
3. Врач-исследователь выясняет зависимость площади пораженной части легких у людей, заболевших эмфиземой легких, от числа лет курения. Статистические данные, собранные им в некоторой области, имеют следующий вид:
Число лет курения 25 36 22 15 48 39 42 31 28 33 Площадь пораженной части легкого, % 55 60 50 30 75 70 70 55 30 35
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если человек курил 30 лет, то сделайте прогноз о степени поражения легких у случайно выбранного пациента, больного эмфиземой.
4. Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 8 различных регионах и соответствующее им число продаж.
Число продаж, шт. 420 380 350 400 440 380 450 420 Цена, тыс. руб. 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0 Постройте график исходных данных и определите вид зависимости. Рассчитайте коэффициент линейной корреляции Пирсона, оцените его значимость при ? = 0,01. Постройте уравнение регрессии и объясните смысл полученных результатов.
5. Опрос случайно выбранных 10 студентов, проживающих в общежитии университета, позволяет выявить зависимость между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.
Средний балл 4,6 4,3 3,8 3,8 4,2 4,3 3,8 4,0 3,1 3,9 Число часов 25 22 9 15 15 30 20 30 10 17 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если студент занимается самостоятельно по 12 ч в неделю, то каков прогноз его успеваемости?
6. Некоторая компания недавно провела рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10 недель компания решила проанализировать эффективность этого вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.).
Объем продаж, тыс. руб. 72 76 78 70 68 80 82 65 62 90 Расходы на рекламу, тыс. руб. 5 8 6 5 3 9 12 4 3 10
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
7. Предположим, что мы имеем случайную выборку из 10 домохозяйств для изучения связи между числом холодильников в домохозяйстве и числом членов домохозяйства. Х - число членов домохозяйства; Y - число холодильников.
Х 6 2 4 3 4 4 6 3 2 2 Y 4 1 3 2 2 3 4 1 2 2
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,01. Постройте уравнение регрессии и дайте интерпретацию полученных результатов.
8. Имеются выборочные данные о стаже работы (X, лет) и выработке одного рабочего за смену (Y, шт.).
Х 1 3 4 5 6 7 Y 14 15 18 20 22 25
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при ? = 0,05. Постройте уравнение регрессии и дайте интерпретацию Полученных результатов.
9. Изучается зависимость себестоимости единицы изделия (Y, тыс. руб.) от величины выпуска продукции (X, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал 5 предприятий и получил следующие данные:
Х 2 3 4 5 6 Y 1,9 1,7 1,8 1,6 1,4
Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости принять равным 0,05?
10. Имеются выборочные данные о глубине вспашки полей под озимые культуры (X, см) и их урожайности (Y, ц/га):
Х 10 15 20 25 30 Y 5 10 16 20 24
При ? = 0,05 установить значимость статистической связи между признаками Х и Y. Если признаки коррелируют, постройте уравнение регрессии и объясните его смысл. Сделайте прогноз урожайности пшеницы при глубине вспашки 22 см.
11. Из студентов 4-го курса одного из факультетов университета отобраны случайным образом 10 студентов и подсчитаны средние оценки, полученные ими на 1-м (X) и 4-м (Y) курсе. Получены следующие данные:
Х 3,5 4,0 3,8 4,6 3,9 3,0 3,5 3,9 4,5 4,1 Y 4,2 3,9 3,8 4,5 4,2 3,4 3,8 3,9 4,6 3,0
Полагая,что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости принять равным 0,05?
12. Определите тесноту связи между возрастом самолета (X, лет) и стоимостью его эксплуатации (Y, млн руб.) по следующим данным:
Х 1 2 3 4 5 Y 2 4 5 8 10
Установите значимость коэффициента корреляции. Если он значим, то постройте уравнение регрессии и объясните его смысл. Каким будет прогноз стоимости эксплуатации самолета, если его возраст 1,5 года, а уровень значимости принять равным 0,05?
13. Определите тесноту связи объема выпуска продукции (X, тыс. шт.) и себестоимости единицы изделия (Y, тыс. руб.) на основе следующих данных:
Х 3 4 5 6 7 Y 10 8 7 5 2
Проверьте значимость выборочного коэффициента корреляции при ? = 0,05. Постройте уравнение линейной регрессии и объясните его.
14. Определите тесноту связи общего веса некоторого растения (X, г) и веса его семян (Y, г) на основе следующих выборочных данных:
Х 40 50 60 70 80 90 100 Y 20 25 28 30 35 40 45
Проверьте значимость выборочного коэффициента корреляции при ? =0,05. Постройте линейное уравнение регрессии и объясните его.
15. При исследовании зависимости времени, затраченного на закрепление детали на токарном станке, от веса детали, получены следующие результаты (X - вес детали, кг, Y - время закрепления детали, с):
Х 7 8 10 12 13 14 15 17 18 20 Y 2,2 2,3 2,4 2,5 2,6 2,7 2,8 3,0 3,1 3,2
Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Х и Y, если уровень значимости принять равным 0,05?
16. Семь вновь принятых сотрудников брокерской компании проходят аттестацию в конце испытательного периода. Результаты их работы оцениваются путем сдачи теста на профессиональную пригодность и по отдаче с каждого инвестированного ими рубля. Результаты молодых специалистов были ранжированы следующим образом:
Молодые специалисты А В С D E F G Результат теста 3 2 6 4 1 7 5 Отдача с рубля 1 3 5 2 4 6 7
Вычислите коэффициент корреляции рангов Спирмена, оцените его значимость.
17. Следующие данные получены из случайной выборки по оборотам 8 годовых консолидированных балансов. Цифры в таблице показывают объем продаж, тыс. шт., и цену единицы товара, руб.
Продажа 12,2 18,6 29,2 15,7 25,4 35,2 14,7 11,17 Цена 29,2 30,5 29,7 31,3 30,8 29,9 27,8 27,0
Рассчитайте выборочный коэффициент корреляции Пирсона между объемом продаж и ценой товара. Проверьте значимость коэффициента корреляции для ? = 0,05.
18. Перед сдачей экзаменов в конце семестра в 20 группах студентов университета был проведен опрос о том, какую оценку по сдаваемым в сессию курсам они ожидают получить. После сессии средние полученные оценки были сопоставлены со средними ожидаемыми. Результаты приведены в таблице:
Ожидаемая 3,4 3,1 3,0 2,8 3,7 3,5 2,9 3,7 3,5 3,2 Полученная 4,1 3,4 3,3 3,0 4,7 4,6 3,0 4,6 4,6 3,6 Ожидаемая 3,0 3,5 3,3 3,1 3,3 3,9 2,9 3,2 3,4 3,4 Полученная 3,5 4,0 3,6 3,1 3,3 4,5 2,8 3,7 3,8 3,9 Рассчитайте линейный коэффициент корреляции Пирсона, оцените его значимость при ?=0,05.
19. Организация стран-экспортеров нефти предпринимает попытки контроля над ценами на сырую нефть с 1973г. Цены на сырую нефть резко возрастали с середины 70-х до середина 80-х гг., что повлекло за собой некоторое повышение цен на бензин. Следующая таблица представляет средние цены на сырую нефть и бензин с 1975 по 1988г.
Год
Бензин, Y - центов за галлон
Сырая нефть, X - дол. за баррель
1975
57
7,67
1976
59
8,19
1977
62
8,57
1978
63
9,00
1979
86
12,64
1980
119
21,59
1981
133
31,77
1982
122
28,52
1983
116
26,19
1984
113
25,88
1985
112
24,09
1986
86
12,51
1987
90
15,40
1988
90
12,57
Постройте график и оцените характер взаимодействия между переменными. Рассчитайте параметры уравнения регрессии, оценивающего зависимость цен на галлон бензина от цен за баррель сырой нефти. Дайте интерпретацию полученных результатов.
20. Имеются данные по 14 предприятиям о производительности труда (Y, шт.) и коэффициенте механизации работ (X, %)
X
32
30
36
40
41
47
56
54
60
55
61
67
69
76
Y
20
24
28
30
31
33
34
37
38
40
41
43
45
48
Проверьте значимость выборочного коэффициента корреляции при ? = 0,05. Постройте уравнение линейной регрессии и объясните его.
ЛИТЕРАТУРА
Абезгауз Г. Г., Тронь А. П., Коненкин Ю. Н., Коровина И. А. Справочник по вероятностным расчетам. М., 1970.
Белинский В. А., Калихман И. А., Майстров Л. Я., Митькин А. М. Высшая математика с основами математической статистики. М., 1965.
Вайнберг Дж., Шумекер Дж. Статистика. М., 1979.
Варден Ван-дер Б. Л. Математическая статистика. М., 1960.
Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе. М., 1974.
Венецкий И. Г., Кильдишев Г. С. Теория вероятностей и математическая статистика. М., 1975.
Вентцель Е. С. Теория вероятностей. М., 1964.
Вентцелъ Е. С., Овчаров Л. А. Теория вероятностей (задачи и упражнения). М., 1969.
Гершгорн А. С. Элементы теории вероятностей и математической статистики. Львов, 1961.
Гмурман В. Е. Руководство к решению задач по теории вероятностей и математической статистике. М., 1975; 1979;1997.
Гмурман В. Е. Теория вероятностей и математическая статистика. М. 1975; 1988.
Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей. М., 1970.
Гнеденко Б. В. Курс теории вероятностей. 6-е изд. М., 1988.
Гурский Е. И. Теория вероятностей с элементами математической статистики. М., 1971.
Дружинин Н. К. Математическая статистика в экономике. М.,1971.
Емельянов Г. В., Скитович В. П. Задачник по теории вероятностей и математической статистике. Л., 1967.
Иванова В. М., Калинина В. Н., Нешумова Л. А; Решетникова И. О. Математическая статистика. М., 1981.
Ивашев-Мусатов О. С. Теория вероятностей и математическая статистика. М., 1979.
Карасев А. И. Теория вероятностей и математическая статистика. М., 1971.
Карасев А. И., Аксютина 3. М., Савельева Т. И. Курс высшей математики для экономических вузов. Ч. II. Теория вероятностей и математическая статистика. М., 1982.
Козлова 3. А. Методические указания по изучению темы "Закон больших чисел". Ростов н/Д, 1979.
Коваленко И. Н., Вилиппова А. А. Теория вероятностей и математическая статистика. 2-е изд. М., 1982.
Колде Я. К. Практикум по теории вероятностей и математической статистике. М., 1991.
Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и математическая статистика. М., 1991.
Колемаев В. А., Калинина В. Н. Теория вероятностей и математическая статистика. М., 1997.
Лихолетов И. И., Мацкевич И. П. Руководство к решению задач по высшей математике с основами математической статистики и теории вероятностей. Минск,1991.
Маринеску И., Мойнягу Ч., Никулеску Р., Ранку Н., Урсяну В. Основы математической статистики и ее применение. М., 1970.
Мостллер Ф., Рурке Р., Томас Дж. Вероятность. М., 1969.
Павловский З. Введение в математическую статистику. М.,1967.
Румшинский Л. З. Элементы теории вероятностей. М.,1970.
Сборник задач по теории вероятностей, математической статистике и теории случайных функций/ Под ред. А. А.Свешникова. М., 1965.
Феллер. В. Введение в теорию вероятностей и ее приложения. М., 1952.
Четыркин Е. И., Калихман И. Л. Вероятность и статистика. М., 1982.
Чистяков В. П. Курс теории вероятностей. 3-е изд. М., 1987.
Aczel A. Complete Business Statistics. 2nd ed./Richard D. Irwin, INC., 1993.
Canavos G. Applied Probability and Statistical Methods. Little, Brown... Company, USA, 1984.
Mendenhall W" Wackerly D., Scheaffer R Mathematical statistics with Applications. PWS-KENT Publishing Company, USA, 1990.
Приложение 1
X 0 1 2 3 4 5 6 7 8 9 0,0
0,3989
0,3989
0,3989
0,3988
0,3986
0,3984
0,3982
0,3980
0,3977
0,3973
0,1
0,3970
0,3965
0,3961
0,3956
0,3951
0,3945
0,3939
0,3932
0,3925
0,3918
0,2
0,3910
0,3902
0,3894
0,3885
0,3876
0,3867
0,3857
0,3847
0,3836
0,3825
0,3
0,3814
0,3802
0,3790
0,3778
0,3765
0,3752
0,3739
0,3725
0,3712
0,3697
0,4
0,3683
0,3668
0,3653
0,3637
0,3621
0,3605
0,3589
0,3572
0,3555
0,3538
0,5
0,3521
0,3503
0,3485
0,3467
0,3448
0,3429
0,3410
0,3391
0,3372
0,3352
0,6