<< Пред.           стр. 6 (из 19)           След. >>

Список литературы по разделу

 Интервальная разность 2-го интервала
 1 000 - 500 = 500.
  Следовательно, нижняя граница 1-го интервала
 500 - 500 = 0.
  Интервальная разность предпоследнего интервала
 3 000 - 2 000 = 1 000.
  Следовательно, верхняя граница последнего интервала
 3 000 + 1 000 = 4 000.
  В результате, получим следующий вариационный ряд (табл. 6.4):
 Таблица 6.4
 xi
  mi
  0-500
  27
  500 - 1 000
  11
  1 000 - 2 000
  8
  2 000 - 3 000
  8
  3 000 - 4 000
  2
 
  Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолютные плотности распределения по формуле (6.6)
 
 
 
 Построим гистограмму (рис. 6.5).
 
  Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.
  Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.
  Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 = 38.
 Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.
  Построим кумуляту (рис. 6.6).
 
  2) Рассчитаем среднюю мощность предприятий цементной промышленности в 1996 г. Так как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариационного ряда в качестве значений признака принимаются середины интервалов, найдем их.
 
  Теперь расчет средней арифметической примет вид
 
  Средняя мощность предприятий цементной промышленности в 1996 г. составляла 964,29 тыс. т.
  Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми интервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закрываются условно, в действительности значения признака у объектов, попадающих в открытые интервалы, могут выходить далеко за их условные границы.
  В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интервального ряда с открытыми интервалами лучше использовать моду или медиану.
 3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.
  Так как частоты неодинаковы, для расчета дисперсии используем формулу (6.12)
 
 Дисперсия мощности предприятий - 862 563,78 (тыс. т)2.
 Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)
 
 Среднее квадратическое отклонение мощности предприятий - 928,74 тыс. т.
 
 Найдем коэффициент вариации по формуле (6.14)
 
  Коэффициент вариации годовой мощности предприятий цементной промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.
  Следовательно, использование средней арифметической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно - средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной совокупности предприятий цементной промышленности.
 
  Задачи к теме 6
  1. По данным выборочного обследования получено следующее распределение семей по среднедушевому доходу
 Среднедушевой доход семьи в месяц, у. е. до 25 25-50 50-75 75-100 100-125 125-150 150 и
 выше Количество обследованных семей 46 236 250 176 102 78 12
  Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.
  2. Постройте гистограмму частот, найдите среднюю заработную работников одного из цехов промышленного предприятия.
 Заработная плата, у. е. 50-75 75-100 125-150 150-175 175-200 200-225 Число работников 12 23 37 19 15 9
  Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.
  3. Ниже представлена группировка отраслей и подотраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.
 Сентябрь 1996 г., % к декабрю 1995 г.
  92,1-100,0 100,1-108,0 108,1-116,0 116,1-124,0 124,1-132,0 132,1-140,0 Число отраслей и подотраслей, единиц
  4 15 21 31 19 18
  Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Постройте гистограмму. Сделайте выводы.
  4. По результатам выборочного обследования торговых киосков города получены следующие данные о дневной выручке частного бизнеса.
 Выручка от продажи товара, тыс. у. е.
  до 1
  1-1,2
  1,2-1,4
  1,4-1,6
  1,6-1,8
  1,8-2,0
  2,0 и выше
  Число торговых киосков
  10
  12
  22
  26
  18
  7
  5
 
  Постройте гистограмму распределения частот. Найдите среднедневную выручку от продажи товаров, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.
  5. Имеются данные о денежной эмиссии, осуществлявшейся ЦБ РФ в период 1991-1994 гг.
 Годы 1991 1992 1993 1994 Размер эмиссии, млрд руб. 89,3 1 513,0 10 904,8 23169,9
  Найдите среднегодовой размер эмиссии за указанный период. Охарактеризуйте колеблемость размера эмиссии с помощью различных показателей вариации.
  6. Для оценки состояния деловой активности промышленных предприятий различных форм собственности были проведены выборочные бизнес-обследования и получены следующие результаты:
 Интервалы значений показателя деловой активности, бал. 0-8 8-16 16-24 24-32 Число предприятий (акционерные общества открытого типа) 10 15 8 5
  Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.
  7. Продажа акций на аукционе акционерными обществами города характеризуется следующими данными:
 Продажа акций, % от уставного капитала 9-15 15-21 21-27 27-33 Число акционерных обществ открытого типа 3 5 4
  2
  Постройте гистограмму распределения частот. Найдите средний процент продажи акций. Охарактеризуйте колеблемость процента продажи акций с помощью соответствующих показателей.
  8. Имеются выборочные данные о числе сделок, заключенных брокерскими фирмами и конторами города в течение месяца.
 Число заключенных сделок
  10-30 30-50 50-70 70-90 Число брокерских фирм и контор
  20 18 12 5
  Постройте гистограмму распределения частот. Найдите среднее число заключенных сделок, дисперсию, среднее квадратическое отклонение, коэффициент вариации, размах вариации. Объясните полученные результаты.
  9. Имеются выборочные данные о стоимости потребительской корзины из 19 основных продуктов по городам Ростовской области (на начало апреля 1996 г.).
 Стоимость потребительской корзины, тыс. руб. 196 208 216 222 227 240 Число городов области 2 3 4 4 5 7
  Постройте полигон распределения частот. Найдите среднюю стоимость потребительской корзины в выборке, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.
  10. Кредиты ЦБ РФ предприятиям России за 7 месяцев 1992 г. (с апреля по октябрь) характеризуются следующими данными:
 Месяц Апрель Май Июнь Июль Август Сентябрь Октябрь Размер кредитов, млрд руб. 918,1 1 025,3 1041,8 1 393,0 1 860,0 2 153,2 2 731,0
  Найдите среднемесячный размер кредита за указанный период. Охарактеризуйте колеблемость размеров кредита с помощью соответствующих показателей.
  11. Предположим, что на некотором предприятии собраны данные о числе дней, пропущенных работниками по болезни.
 Число дней, пропущенных в текущем месяце 0 1 2 3 4 5 Число работников 10 17 25 28 30 27
  Постройте полигон распределения частот. Найдите среднее число пропущенных дней, стандартное отклонение, коэффициент вариации. Является ли распределение симметричным?
 
  12. Постройте гистограмму частот, найдите среднюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники.
 Выручка, у. е. 0-200 200-300 300-400 400-500 500-600 600-700 Число дн. 3 5 9 14 8 3 13. Имеются данные о числе тонн грузов, перевозимых еженедельно паромом некоторого морского порта в период навигации: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499, 580, 606, 344, 455, 505, 396, 347, 441, 390, 632, 400, 582.
  Составьте вариационный ряд. Найдите среднюю арифметическую. Рассчитайте показатели вариации ряда. Сделайте анализ полученных результатов.
  14. Предположим, у вас есть следующая информация об акциях А и В:
 Экономическое состояние в следующем году Вероятность того, что произойдет Возврат по акции В в следующем году, % Возврат по
 акции А в следующем году, % Снижение деловой активности 0,3 9,8 10 Умеренный рост 0,4 11,2 11 Подъем деловой активности 0,3 13 12
  Рассчитайте среднюю арифметическую, дисперсию и коэффициент вариации для акций А и В. Если вы решили купить одну акцию, какую из двух вы выберете? Почему?
  15. Проанализируйте данные годовых уровней прибыли трех компаний.
 Год Cherry Computers
  Lemon Motors
  Orange Electronics
  1983 14,2 -6,2 37,5 1984 12,3 13,3 -10,6 1985 -16,2 -8,4 40,3 1986 15,4 27,3 5,4 1987 17,2 28,2 6,2 1988 10,3 14,5 10,2 1989 -6,3 -2,4 13,8 1990 -7,8 -3,1 11,5 1991 3,4 15,6 -6,2 1992 12,2 18,2 27,5
  Найдите среднее значение и стандартное отклонение прибыли для каждой из компаний. Сравните результаты их деятельности за 10 лет. Деятельность какой из компаний, по вашему мнению, более успешна?
  16. Таблица, приведенная ниже, содержит данные о стоимости акций Charleston Corporation в различных экономических ситуациях.
 Экономическое состояние в следующем году Вероятность того, что произойдет Цена за акцию, дол. США Кризис 0,25 65 Снижение деловой активности 0,25 80 Умеренный рост 0,3 95 Подъем деловой активности 0,2 100
  Рассчитайте среднюю стоимость акций, дисперсию и коэффициент вариации. Проанализируйте полученные результаты.
  17. Администрацию универсама интересует оптимальный уровень запасов продуктов в торговом зале, а также среднемесячный объем покупок товаров, не являющихся предметом ежедневного потребления в семье (таких, например, как сода). Для выяснения этого вопроса менеджер универсама в течение января регистрировал частоту покупок стограммовых пакетиков с содой и собрал следующие данные (хi): 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6,5,7,3,2,9,8,1,4,6,5,4,2,1, 0,8.
  Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?
  18. Ниже приводятся данные о возрастном составе безработных по Российской Федерации, зарегистрированных в службе занятости по сведениям на последнюю неделю марта 1996 г., %.
 Возраст, лет 16-20 20-24 25-29 30-49 50-54 55-59 60-65 Мужчины 7,7 17,0 11,9 50,9 4,2 5,7 2,6 Женщины 11,2 18,5 11,7 49,5 4,0 3,8 1,3
  Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных мужчин и женщин. Сделайте выводы.
  19. Число пассажиров компании "Донские авиалинии" одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего года составило: 128, 121, 134, 118, 123, 109,120,116,125,128,121,129,130,131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132,136,134,129.
  Составьте вариационный ряд. Чему равно среднее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных результатов.
  20. Имеются данные о группировке коммерческих банков РФ по величине объявленного уставного фонда (на 1 марта 1995 г.).
 Объявленный уставной фонд, руб. До 100 млн 100-500 млн 500 млн-1 млрд Свыше 1 млрд Число коммерческих банков 87 1075 377 1004
  Постройте гистограмму распределения частот. Найдите средний размер объявленного уставного фонда коммерческих банков РФ. Охарактеризуйте колеблемость размера объявленного уставного фонда коммерческих банков с помощью соответствующих показателей.
 
 7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ
  7.1. Основные понятия и определения выборочного метода
  По одному из популярных определений, статистика - это наука, позволяющая распространять выводы, сделанные на основе изучения части совокупности (случайной выборки), на всю совокупность (генеральную совокупность). В этом определении заключена сущность выборочного метода и его ведущая роль в статистике.
  Все единицы совокупности, обладающие интересующими исследователя признаками, составляют генеральную совокупность.
  Часть совокупности, случайным образом отобранная из генеральной совокупности, - выборочная совокупность - выборка.
  Число единиц (элементов) статистической совокупности называется ее объемом*. Объем генеральной совокупности обозначается N, а объем выборочной совокупности - п. Если объем совокупности велик, то его полагают равным бесконечности.
  * В учебниках по математической статистике вместо термина "статистическая совокупность" используется термин "набор данных", а вместо термина "единица совокупности" используется термин "элемент выборки".
 
  Случайная выборка из п элементов - это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требование случайности обеспечивается отбором по таблицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечивается равная возможность попадания в тираж любого номера лотерейного билета.
  По способу отбора элементов различают два типа случайных выборок: собственно-случайная повторная (схема возвращенного шара); собственно-случайная бесповторная (схема невозвращенного шара).
  Выбор схемы отбора зависит от характера изучаемого объекта. Напомним, что при повторном отборе единица наблюдения после извлечения из генеральной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять может быть извлечена случайным образом. При бесповторном отборе элемент в выборку не возвращается. Следует отметить, что независимо от способа организации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т. е. быть представительной (репрезентативной).
 
  7.2. Статистическое оценивание
  Пусть из генеральной совокупности извлекается выборка объемом n, причем значение признака х1 наблюдается т1 раз, x2 т2 раз,..., хk наблюдается тk раз,
 
  Мы можем сопоставить каждому значению хi относительную частоту mi/n.
  Статистическим распределением выборки называется перечень возможных значений признака хi и соответствующих ему частот или относительных частот (частостей) mi (?i).
  Числовые характеристики генеральной совокупности, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначают, например, ?X или Xген , ?2ген). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.
  По данным выборки рассчитывают числовые характеристики, которые называют cтатистиками (обозначают X??, или X? ген ,?2ген, выборочная доля обозначается ?). Статистики, получаемые по различным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из выборки, является только оценкой неизвестного параметра генеральной совокупности. Оценка параметра - определенная числовая характеристика, полученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.
  В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел и центральная предельная теорема Ляпунова.
  Выборочная средняя является точечной оценкой генеральной средней, т. е.
 
 
  Генеральная дисперсия имеет 2 точечные оценки: ?2выб - выборочная дисперсия; S2- исправленная выборочная дисперсия*. ?2выб исчисляется при п > 30, a S2 - при n < 30. Причем в математической статистике доказывается, что
 
  При больших объемах выборки ?2выб и S2 практически совпадают.
  Генеральное среднее квадратическое отклонение ?ген также имеет 2 точечные оценки: ?выб - выборочное среднее квадратическое отклонение и S - исправленное выборочное среднее квадратическое отклонение. ?выб используется для оценивания ?ген при п > 30, а S для оценивания (?ген при п < 30; при этом
 
  * Для того чтобы любые статистики служили хорошими оценками параметров генеральной совокупности, они должны обладать рядом свойств: несмещенности, эффективности, состоятельности, достаточности. Всем указанным свойствам отвечает выборочная средняя, ?2выб - смещенная оценка. Для устранения смещения при малых выборках вводится поправка п/п-1 (см. 7.1).
  7.3. Ошибки выборки
 Поскольку выборочная совокупность представляет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристики не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности: ? = X? -?X , либо е= р -?.
 
  Применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.
 
 
 где Х? - средняя по совокупности выбранных единиц; ?X - средняя по генеральной совокупности.
 ?ген - среднее квадратическое отклонение в генеральной совокупности.
 Запись показывает, что о величине расхождения между параметром и статистикой
 
 можно судить лишь с определенной вероятностью, от которой зависит величина t.
 Формула (7.2) устанавливает связь между пределом ошибки, гарантируемым с некоторой вероятностью Р, величиной t и средней ошибкой выборки
 
  Согласно центральной предельной теореме Ляпунова, выборочные распределения статистик (при п ?V? 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная совокупность. Следовательно,
 
 где Ф0(t) - функция Лапласа.
 Значения вероятностей, соответствующие различным t, содержатся в специальных таблицах:
 при п > 30 - в таблице значений Ф0(t), а при n < 30 в таблице распределения t-Стьюдента. Неизвестное значение ?ген при расчете ошибки выборки заменяется ?выб.
  В зависимости от способа отбора средняя ошибка выборки определяется по-разному (табл. 7.1).
 Таблица 7.1
  Формулы расчета ошибки выборки для собственно-случайного отбора
 
  Здесь ?2 - выборочная дисперсия значений признака; ? (1 - ? ) - выборочная дисперсия доли значений признака; n - объем выборки; N - объем генеральной совокупности; n/N - доля обследованной совокупности; (1- n/N) - поправка на конечность совокупности (в литературе (1 - n/N) иногда называется "поправкой на бесповторность отбора").
  7.4. Определение численности (объема) выборки
 Одной из важнейших проблем выборочного метода является определение необходимого объема выборки (табл. 7.2). От объема выборки зависит размер средней ошибки (?) и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки. Из формулы предельной ошибки ? = t?? и формул средних ошибок выборки определяются формулы необходимой численности выборки для различных способов отбора.
 Таблица 7.2
 Формулы, расчета необходимой численности выборки для собственно-случайного отбора
 
 
  7.5. Интервальное оценивание
  Пусть ? = X? - X . Если ? представляет собой предел, которым ограничена сверху абсолютная величина |?| < ?, то | Х -X | < ?. Следовательно,
 
 Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что
 
  Интервальной оценкой называют оценку, которая определяется 2 числами - концами интервала, который с определенной вероятностью накрывает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом. Для его определения вычисляется предельная ошибка выборки ?, позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности.
  Предельная ошибка выборки равна t-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы выберем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% - неправильным, то мы говорим: со статистической надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность - 0,95. В 5% случаев утверждение "параметр принадлежит доверительному интервалу" будет неверным, т. е. 5% задает уровень значимости (?) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% (? < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания.
  С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.
  Для оценки математического ожидания а (генеральной средней)* нормально распределенного количественного признака Х по выборочной средней X? при известном среднем квадратическом отклонении ? генеральной совокупности (на практике - при большом объеме выборки, т. е. при п ? 30) и собственно-случайном повторном отборе формула (7.5) примет вид
 
 где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = ?; ?- среднее квадратическое отклонение; п - объем выборки (число обследованных единиц).
 
  * Для нормально распределенной случайной величины М(X?) = а ??X. Поэтому справедливо Р(X?- а| < ?) ??X.
 
  Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней X? при известном среднем квадратическом отклонении ? генеральной совокупности (при большом объеме выборки, т. е. при п ? 30) и собственно-случайном бесповторном отборе формула (7.6) примет вид
 
  Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней Х? при неизвестном среднем квадратическом отклонении (? генеральной совокупности (на практике - при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (7.6) будет иметь вид
 
 где t определяется по таблицам Стьюдента (приложение 5), по уровню значимости ? = 1 - ? и числу степеней свободы k = п - 1; ? - исправленное выборочное среднее квадратическое отклонение; п - объем выборки.
 
  Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней X? при неизвестном среднем квадратическом отклонении ?- генеральной совокупности (при малом объеме выборки, т. е. при п < 30) и собственно-случайном бесповторном отборе формула (7.8) примет вид
 
  Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле ?= т/п (при большом объеме выборки, т. е. при п ? 30) и собственно-случайном повторном отборе формула (7.5) будет иметь вид
 
 где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = ?; ? - выборочная доля; п - объем выборки (число обследованных единиц);
 
  Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле ? = т/п (при большом объеме выборки, т. е. при п ? 30) и собственно-случайном бесповторном отборе формула (7.10) примет вид
 
  Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле ? = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (7.10) примет вид
 
 где t определяется по таблицам Стьюдента (приложение 5), по уровню значимости ? = 1 - ? и числу степеней свободы k = п - 1.
 
  Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле ? = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном беспоторном отборе формула (7.12) будет иметь вид
 
  Пример 1. С помощью собственно-случайного повторного отбора руководство фирмы провело выборочное обследование 900 своих служащих. Средний стаж их работы в фирме равен 8,70 года, а среднее квадратическое (стандартное) отклонение - 2,70 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих фирмы распределенным по нормальному закону, определите: а) с вероятностью 0,95 доверительный интервал, в котором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0,90 доверительный интервал, накрывающий неизвестную долю женщин во всем коллективе фирмы.
  Решение. По условию задачи выборочное обследование проведено с помощью собственно-случайного повторного отбора. Объем выборки п = 900 единиц, т. е. выборка большая.
  а) Найдем границы доверительного интервала среднего стажа работы всего коллектива фирмы, т. е. границы доверительного интервала для генеральной средней.
  По условию X? = 8,70; ?= 2,70; п = 900; ?= 0,95. Используем формулу
 
 Найдем t из соотношения 2Ф0(t) = ?: 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0.475.
  По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.
  Следовательно, t = 1,96.
 Найдем предельную ошибку выборки
 
  С вероятностью 0,95 можно ожидать, что средний стаж работы всего коллектива фирмы находится в интервале от 8,5236 до 8,8764 года.
  б) Теперь оценим истинное значение доли женщин во всем коллективе фирмы.
  По условию т = 270; п = 900; ?= 0,90.
  Выборочная доля ? = 270/900 = 0,30.
  Используем формулу
 
 
 Найдем t из соотношения 2Ф0(t) = ? 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.
  По таблице функции Лапласа (приложение 2) определим, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.
  Следовательно, t = 1,64.
  Предельная ошибка выборки определяется по формуле
 
  Итак, с вероятностью 0,90 можно ожидать, что доля женщин во всем коллективе фирмы находится в интервале от 0,2749 до 0,3251.
  Ответ. Можно ожидать, что с вероятностью 0,95 средний стаж работы всех служащих фирмы находится в интервале от 8,5236 до 8,8764 года. С вероятностью 0,90 можно гарантировать, что доля женщин во всем коллективе фирмы находится в интервале от 0,2749 до 0,3251.
 Пример 2. Изменим условие примера 1.
 1) С помощью собственно-случайного повторного отбора определяется средний стаж работы служащих фирмы. Предполагается, что он подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0,95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0,50 года, если стандартное отклонение ? равно 2,70 года?
  2) Каким должен быть объем собственно-случайной повторной выборки, чтобы с надежностью 0,90 можно было утверждать, что максимальное отклонение выборочной доли женщин в выборке от доли женщин во всем коллективе фирмы не превышало 0,05, если в прошлом аналогичном обследовании выборочная доля женщин оказалась равной 0,30?
  Решение. В данной задаче нужно найти необходимую численность выборки. Ее расчет дает ответ на вопрос: "Сколько нужно обследовать единиц совокупности, чтобы с заранее заданной вероятностью не превысить заранее заданную ошибку?"
  1) Дано: ? = 0,50; ?= 2,70;??= 0,95.
  По условию задачи требуется найти необходимую численность выборки для средней при повторном отборе. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном повторном отборе: п = t2?2/?2.
  Неизвестное значение t найдем из соотношения 2Ф0(t) = ? 2Ф0(t) = 0,95; Ф0(t)= 0,95/2 = 0,475.
  По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.
  Следовательно, t = 1,96.
  Рассчитаем необходимую численность выборки
 
  Так как п - целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
  Следовательно, надо обследовать не менее 113 служащих.
  Ответ. Чтобы с вероятностью 0,95 и D = 0,50 года с помощью собственно-случайного повторного отбора определить средний стаж работы в фирме, необходимо обследовать не менее 113 служащих.
  2) Дано: ? = 0,05; ? = 0,30; ?= 0,90.
  По условию задачи требуется найти необходимую численность выборки для доли при собственно-случайном повторном отборе.
  Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-случайном повторном отборе:
 
 Найдем t из соотношения 2Ф0(t) = ?. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.
  По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45. Следовательно, t = 1,64.
  Рассчитаем необходимую численность выборки:
 
  Так как п - целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
  Следовательно, п ? 226.
  Ответ. Чтобы с вероятностью 0,90 и ошибкой ??0,05 с помощью собственно-случайного повторного отбора определить долю женщин во всем коллективе фирмы, необходимо обследовать не менее 226 служащих.
  Пример 3. Владелец автостоянки опасается обмана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем автостоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа - 10 автомобилей. Считая отбор собственно-случайным, с вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь на охрану. Обоснованы ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?
  Решение. По условию задачи выборочное обследование проведено с помощью собственно-случайного отбора. Очевидно, что отбор - бесповторный, так как не имеет смысла производить проверку более 1 раза в сутки. Объем выборки n = 40, что больше 30 единиц, т. е. выборка большая. Объем генеральной совокупности N = 365.
  Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней.
  По условию
 Х?= 400; ??= 10; п = 40; ?= 0,99; N=365. Используем формулу
 
 Найдем t из соотношения 2Ф (t) = ?. 2Ф0(t) = 0,99; Ф0(t) = 0,99/2 = 0,495.
  По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,495. Ф0(2,58) = 0,495.
  Следовательно, t = 2,58.
  Найдем предельную ошибку выборки:
 
  Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца.
  Пример 4. В 24 из 40 проверок число автомобилей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интервал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.
  Решение. Определим границы доверительного интервала для доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.
  По условию т = 24; п = 40; ? =.0,98.
 Выборочная доля ? = 24/40 = 0,60. Так как
 
 то найдем t из соотношения 2Ф0(t) = ?. 2Ф0(t) = 0,98; Ф0(t) = 0,98/2 = 0,49.
  По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,49. Ф0(2,33) = 0,49.
  Следовательно, t = 2,33.

<< Пред.           стр. 6 (из 19)           След. >>

Список литературы по разделу