<< Пред.           стр. 6 (из 19)           След. >>

Список литературы по разделу

  92,1-100,0100,1-108,0108,1-116,0116,1-124,0124,1-132,0132,1-140,0
 Число отраслей и подотраслей, единиц
  41521311918
 
 
 Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент ва­риации. Постройте гистограмму. Сделайте выводы.
 4. По результатам выборочного обследования тор­говых киосков города получены следующие данные о дневной выручке частного бизнеса.
 Выручка от продажи товара, тыс. у. е.
  до 1
  1-1,2
  1,2-1,4
  1,4-1,6
  1,6-1,8
  1,8-2,0
  2,0 и выше
 
 Число торговых киосков
  10
  12
  22
  26
  18
  7
  5
 
 
 
 Постройте гистограмму распределения частот. Найдите среднедневную выручку от продажи товаров, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.
 5. Имеются данные о денежной эмиссии, осуще­ствлявшейся ЦБ РФ в период 1991-1994 гг.
 Годы1991199219931994
 Размер эмиссии, млрд руб.89,31 513,010 904,823169,9
 
 
 Найдите среднегодовой размер эмиссии за ука­занный период. Охарактеризуйте колеблемость размера эмиссии с помощью различных показателей вариации.
 6. Для оценки состояния деловой активности промышленных предприятий различных форм собственности были проведены выборочные бизнес-об­следования и получены следующие результаты:
 Интервалы значений показателя деловой активности, бал.0-88-1616-2424-32
 Число предприятий (акционерные общества открытого типа)101585
 
 
 Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.
 7. Продажа акций на аукционе акционерными обществами города характеризуется следующими данными:
 Продажа акций, % от уставного капитала9-1515-2121-2727-33
 Число акционерных обществ открытого типа354
  2
 
 
 Постройте гистограмму распределения частот. Найдите средний процент продажи акций. Охарактеризуйте колеблемость процента продажи акций с помощью соответствующих показателей.
 8. Имеются выборочные данные о числе сделок, заключенных брокерскими фирмами и конторами города в течение месяца.
 Число заключенных сделок
  10-3030-5050-7070-90
 Число брокерских фирм и контор
  2018125
 
 
 Постройте гистограмму распределения частот. Найдите среднее число заключенных сделок, дисперсию, среднее квадратическое отклонение, коэф­фициент вариации, размах вариации. Объясните полученные результаты.
 9. Имеются выборочные данные о стоимости по­требительской корзины из 19 основных продуктов по городам Ростовской области (на начало апреля 1996 г.).
 Стоимость потребительской корзины, тыс. руб.196208216222227240
 Число городов области234457
 
 
 Постройте полигон распределения частот. Най­дите среднюю стоимость потребительской корзины в выборке, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.
 10. Кредиты ЦБ РФ предприятиям России за 7 ме­сяцев 1992 г. (с апреля по октябрь) характеризуют­ся следующими данными:
 МесяцАпрельМайИюньИюльАвгустСентябрьОктябрь
 Размер кредитов, млрд руб.918,11 025,31041,81 393,01 860,02 153,22 731,0
 
 
 Найдите среднемесячный размер кредита за ука­занный период. Охарактеризуйте колеблемость размеров кредита с помощью соответствующих пока­зателей.
 11. Предположим, что на некотором предприя­тии собраны данные о числе дней, пропущенных работниками по болезни.
 Число дней, пропущенных в текущем месяце012345
 Число работников101725283027
 
 
 Постройте полигон распределения частот. Най­дите среднее число пропущенных дней, стандарт­ное отклонение, коэффициент вариации. Является ли распределение симметричным?
 
 12. Постройте гистограмму частот, найдите сред­нюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники.
 Выручка, у. е.0-200200-300300-400400-500500-600600-700
 Число дн.3591483
 
 13. Имеются данные о числе тонн грузов, пере­возимых еженедельно паромом некоторого морско­го порта в период навигации: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499, 580, 606, 344, 455, 505, 396, 347, 441, 390, 632, 400, 582.
 Составьте вариационный ряд. Найдите среднюю арифметическую. Рассчитайте показатели вариации ряда. Сделайте анализ полученных результатов.
 14. Предположим, у вас есть следующая информация об акциях А и В:
 Экономическое состояние в следующем годуВероятность того, что произойдетВозврат по акции В в следующем году, %Возврат по
 акции А в следующем году, %
 Снижение деловой активности0,39,810
 Умеренный рост0,411,211
 Подъем деловой активности0,31312
 
 
 Рассчитайте среднюю арифметическую, диспер­сию и коэффициент вариации для акций А и В. Если вы решили купить одну акцию, какую из двух вы выберете? Почему?
 15. Проанализируйте данные годовых уровней прибыли трех компаний.
 ГодCherry Computers
  Lemon Motors
  Orange Electronics
 
 198314,2-6,237,5
 198412,313,3-10,6
 1985-16,2-8,440,3
 198615,427,35,4
 198717,228,26,2
 198810,314,510,2
 1989-6,3-2,413,8
 1990-7,8-3,111,5
 19913,415,6-6,2
 199212,218,227,5
 
 
 Найдите среднее значение и стандартное откло­нение прибыли для каждой из компаний. Сравните результаты их деятельности за 10 лет. Деятельность какой из компаний, по вашему мнению, более успешна?
 16. Таблица, приведенная ниже, содержит дан­ные о стоимости акций Charleston Corporation в различных экономических ситуациях.
 Экономическое состояние в следующем годуВероятность того, что произойдетЦена за акцию, дол. США
 Кризис0,2565
 Снижение деловой активности0,2580
 Умеренный рост0,395
 Подъем деловой активности0,2100
 
 
 Рассчитайте среднюю стоимость акций, диспер­сию и коэффициент вариации. Проанализируйте полученные результаты.
 17. Администрацию универсама интересует оп­тимальный уровень запасов продуктов в торговом зале, а также среднемесячный объем покупок това­ров, не являющихся предметом ежедневного потребления в семье (таких, например, как сода). Для вы­яснения этого вопроса менеджер универсама в те­чение января регистрировал частоту покупок сто­граммовых пакетиков с содой и собрал следующие данные (хi): 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6,5,7,3,2,9,8,1,4,6,5,4,2,1, 0,8.
 Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?
 18. Ниже приводятся данные о возрастном со­ставе безработных по Российской Федерации, зарегистрированных в службе занятости по сведениям на последнюю неделю марта 1996 г., %.
 Возраст, лет16-2020-2425-2930-4950-5455-5960-65
 Мужчины7,717,011,950,94,25,72,6
 Женщины11,218,511,749,54,03,81,3
 
 
 Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных муж­чин и женщин. Сделайте выводы.
 19. Число пассажиров компании «Донские авиа­линии» одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего года составило: 128, 121, 134, 118, 123, 109,120,116,125,128,121,129,130,131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132,136,134,129.
 Составьте вариационный ряд. Чему равно сред­нее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных резуль­татов.
 20. Имеются данные о группировке коммерчес­ких банков РФ по величине объявленного уставно­го фонда (на 1 марта 1995 г.).
 Объявленный уставной фонд, руб.До 100 млн100-500 млн500 млн-1 млрдСвыше 1 млрд
 Число коммерческих банков8710753771004
 
 
 Постройте гистограмму распределения частот. Найдите средний размер объявленного уставного фонда коммерческих банков РФ. Охарактеризуйте колеблемость размера объявленного уставного фон­да коммерческих банков с помощью соответствую­щих показателей.
 
 7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ
 7.1. Основные понятия и определения выборочного метода
 По одному из популярных определений, статис­тика — это наука, позволяющая распространять выводы, сделанные на основе изучения части со­вокупности (случайной выборки), на всю совокуп­ность (генеральную совокупность). В этом опреде­лении заключена сущность выборочного метода и его ведущая роль в статистике.
 Все единицы совокупности, обладающие интере­сующими исследователя признаками, составляют генеральную совокупность.
 Часть совокупности, случайным образом отобран­ная из генеральной совокупности, — выборочная совокупность — выборка.
 Число единиц (элементов) статистической со­вокупности называется ее объемом*. Объем генеральной совокупности обозначается N, а объем вы­борочной совокупности — п. Если объем совокупно­сти велик, то его полагают равным бесконечности.
 * В учебниках по математической статистике вместо терми­на «статистическая совокупность» используется термин «набор данных», а вместо термина «единица совокупности» ис­пользуется термин «элемент выборки».
 
 Случайная выборка из п элементов — это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требо­вание случайности обеспечивается отбором по таб­лицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечивается равная возможность попадания в тираж лю­бого номера лотерейного билета.
 По способу отбора элементов различают два типа случайных выборок: собственно-случайная повтор­ная (схема возвращенного шара); собственно-случай­ная бесповторная (схема невозвращенного шара).
 Выбор схемы отбора зависит от характера изучае­мого объекта. Напомним, что при повторном отборе единица наблюдения после извлечения из генераль­ной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять мо­жет быть извлечена случайным образом. При бес­повторном отборе элемент в выборку не возвращает­ся. Следует отметить, что независимо от способа орга­низации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т. е. быть представительной (репрезентативной).
 
 7.2. Статистическое оценивание
 Пусть из генеральной совокупности извлекается вы­борка объемом n, причем значение признака х1 наблю­дается т1 раз, x2 т2 раз,..., хk наблюдается тk раз,
 Мы можем сопоставить каждому значению хi от­носительную частоту mi/n.
 Статистическим распределением выборки назы­вается перечень возможных значений признака хi и соответствующих ему частот или относитель­ных частот (частостей) mi (?i).
 Числовые характеристики генеральной совокупности, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначают, например, `X или Xген , s2ген). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.
 По данным выборки рассчитывают числовые характеристики, которые называют cтатистиками (обозначают X?, или X/ ген ,s2ген, выборочная доля обозначается ?). Статистики, получаемые по раз­личным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из вы­борки, является только оценкой неизвестного пара­метра генеральной совокупности. Оценка парамет­ра — определенная числовая характеристика, по­лученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.
 В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обосно­вание возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чи­сел и центральная предельная теорема Ляпунова.
 Выборочная средняя является точечной оценкой генеральной средней, т. е.
 
 Генеральная дисперсия имеет 2 точечные оцен­ки: s2выб — выборочная дисперсия; S2— исправлен­ная выборочная дисперсия*. s2выб исчисляется при п > 30, a S2 — при n < 30. Причем в математичес­кой статистике доказывается, что
 При больших объемах выборки s2выб и S2 практи­чески совпадают.
 Генеральное среднее квадратическое отклонение sген также имеет 2 точечные оценки: sвыб — выбо­рочное среднее квадратическое отклонение и S — исправленное выборочное среднее квадратическое отклонение. sвыб используется для оценивания sген при п > 30, а S для оценивания (sген при п < 30; при этом
 * Для того чтобы любые статистики служили хорошими оценка­ми параметров генеральной совокупности, они должны обладать рядом свойств: несмещенности, эффективности, состоятельнос­ти, достаточности. Всем указанным свойствам отвечает выбо­рочная средняя, s2выб — смещенная оценка. Для устранения сме­щения при малых выборках вводится поправка п/п—1 (см. 7.1).
 7.3. Ошибки выборки
 Поскольку выборочная совокупность представля­ет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристи­ки не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности: e = X/ -`X , либо е= р –?.
 
  Применительно к выборочному методу из теоре­мы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.
 
 где Х? — средняя по совокупности выбранных единиц; `X — средняя по генеральной совокупности.
 sген — среднее квадратическое отклонение в гене­ральной совокупности.
 Запись показывает, что о величине расхождения между параметром и статистикой
 можно судить лишь с определенной вероятностью, от которой зависит величина t.
 Формула (7.2) устанавливает связь между преде­лом ошибки, гарантируемым с некоторой вероят­ностью Р, величиной t и средней ошибкой выборки
 Согласно центральной предельной теореме Ляпуно­ва, выборочные распределения статистик (при п ?V? 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная со­вокупность. Следовательно,
 где Ф0(t) — функция Лапласа.
 Значения вероятностей, соответствующие раз­личным t, содержатся в специальных таблицах:
 при п > 30 — в таблице значений Ф0(t), а при n < 30 в таблице распределения t-Стьюдента. Неизвест­ное значение sген при расчете ошибки выборки за­меняется sвыб.
 В зависимости от способа отбора средняя ошиб­ка выборки определяется по-разному (табл. 7.1).
 Таблица 7.1
 Формулы расчета ошибки выборки для собственно-случайного отбора
 Здесь s2 — выборочная дисперсия значений при­знака; ? (1 - ? ) — выборочная дисперсия доли значений признака; n — объем выборки; N — объем генеральной совокупности; n/N — доля обследован­ной совокупности; (1- n/N) — поправка на конеч­ность совокупности (в литературе (1 - n/N) иногда называется «поправкой на бесповторность отбора»).
 7.4. Определение численности (объема) выборки
 Одной из важнейших проблем выборочного метода является определение необходимого объема выборки (табл. 7.2). От объема выборки зависит размер средней ошибки (m) и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки. Из формулы предельной ошибки D = tm. и фор­мул средних ошибок выборки определяются фор­мулы необходимой численности выборки для различных способов отбора.
 Таблица 7.2
 Формулы, расчета необходимой численности выборки для собственно-случайного отбора
 
 7.5. Интервальное оценивание
 Пусть ? = X- - X . Если D представляет собой пре­дел, которым ограничена сверху абсолютная величина |e| < D, то | Х -X | < D. Следовательно,
 Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что
 Интервальной оценкой называют оценку, кото­рая определяется 2 числами — концами интерва­ла, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокуп­ности. Интервал, содержащий оцениваемый пара­метр генеральной совокупности, называют дове­рительным интервалом. Для его определения вы­числяется предельная ошибка выборки D, позволя­ющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен на­ходиться параметр генеральной совокупности.
 Предельная ошибка выборки равна t-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно выска­зывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы вы­берем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то мы говорим: со статистичес­кой надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (a) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превы­сил 5% (a < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания.
 С помощью доверительного интервала можно оце­нить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.
 Для оценки математического ожидания а (ге­неральной средней)* нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклоне­нии s генеральной совокупности (на практике — при большом объеме выборки, т. е. при п ? 30) и собственно-случайном повторном отборе формула (7.5) примет вид
 где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = ?; s— сред­нее квадратическое отклонение; п — объем выбор­ки (число обследованных единиц).
 * Для нормально распределенной случайной величины М(X-) = а »`X. Поэтому справедливо Р(X-- а| < D) »`X.
 
 Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклонении s генеральной совокупности (при большом объе­ме выборки, т. е. при п ? 30) и собственно-случай­ном бесповторном отборе формула (7.6) примет вид
 Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней Х- при неизвестном среднем квадратическом отклонении (? генеральной совокупности (на практике — при малом объеме выборки, т. е. при п < 30) и соб­ственно-случайном повторном отборе формула (7.6) будет иметь вид
 где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости ? = 1 — g и числу степеней свободы k = п — 1; s — исправленное вы­борочное среднее квадратическое отклонение; п — объем выборки.
 Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при неизвестном среднем квадратическом отклонении ?- генеральной совокупности (при малом объе­ме выборки, т. е. при п < 30) и собственно-случай­ном бесповторном отборе формула (7.8) примет вид
 Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ?= т/п (при большом объеме выбор­ки, т. е. при п ? 30) и собственно-случайном повторном отборе формула (7.5) будет иметь вид
 где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = g; ? — выборочная доля; п — объем выборки (число обсле­дованных единиц);
 Для оценки генеральной доли р нормально рас­пределенного количественного признака по выбо­рочной доле ? = т/п (при большом объеме выборки, т. е. при п ? 30) и собственно-случайном бесповторном отборе формула (7.10) примет вид
 Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ? = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (7.10) примет вид
 где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости ? = 1 - ? и числу степеней свободы k = п - 1.
 Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ? = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном беспоторном отборе формула (7.12) будет иметь вид
 Пример 1. С помощью собственно-случайного повторного отбора руководство фирмы провело выборочное обследование 900 своих служащих. Сред­ний стаж их работы в фирме равен 8,70 года, а сред­нее квадратическое (стандартное) отклонение — 2,70 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих фирмы распреде­ленным по нормальному закону, определите: а) с вероятностью 0,95 доверительный интервал, в ко­тором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0,90 доверительный интервал, накрывающий неизвестную долю женщин во всем коллективе фирмы.
 Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного повторного отбора. Объем выборки п = 900 единиц, т. е. выборка большая.
 а) Найдем границы доверительного интервала среднего стажа работы всего коллектива фирмы, т. е. границы доверительного интервала для генераль­ной средней.
 По условию X- = 8,70; s= 2,70; п = 900; g= 0,95. Используем формулу
 Найдем t из соотношения 2Ф0(t) = g: 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0.475.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.
 Следовательно, t = 1,96.
 Найдем предельную ошибку выборки
 С вероятностью 0,95 можно ожидать, что сред­ний стаж работы всего коллектива фирмы находит­ся в интервале от 8,5236 до 8,8764 года.
 б) Теперь оценим истинное значение доли жен­щин во всем коллективе фирмы.
 По условию т = 270; п = 900; ?= 0,90.
 Выборочная доля ? = 270/900 = 0,30.
 Используем формулу
 
 Найдем t из соотношения 2Ф0(t) = ? 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.
 По таблице функции Лапласа (приложение 2) определим, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.
 Следовательно, t = 1,64.
 Предельная ошибка выборки определяется по формуле
 Итак, с вероятностью 0,90 можно ожидать, что доля женщин во всем коллективе фирмы находит­ся в интервале от 0,2749 до 0,3251.
 Ответ. Можно ожидать, что с вероятностью 0,95 средний стаж работы всех служащих фирмы находится в интервале от 8,5236 до 8,8764 года. С веро­ятностью 0,90 можно гарантировать, что доля жен­щин во всем коллективе фирмы находится в интер­вале от 0,2749 до 0,3251.
 Пример 2. Изменим условие примера 1.
 1) С помощью собственно-случайного повторного отбора определяется средний стаж работы служа­щих фирмы. Предполагается, что он подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0,95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0,50 года, если стан­дартное отклонение ? равно 2,70 года?
 2) Каким должен быть объем собственно-случай­ной повторной выборки, чтобы с надежностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли женщин в выборке от доли женщин во всем коллективе фирмы не превышало 0,05, если в прошлом аналогичном обследовании выборочная доля женщин оказалась равной 0,30?
 Решение. В данной задаче нужно найти необхо­димую численность выборки. Ее расчет дает ответ на вопрос: «Сколько нужно обследовать единиц со­вокупности, чтобы с заранее заданной вероятнос­тью не превысить заранее заданную ошибку?»
 1) Дано: D = 0,50; s= 2,70; g= 0,95.
 По условию задачи требуется найти необходимую численность выборки для средней при повторном отборе. Воспользуемся формулой расчета необходи­мой численности выборки для средней при собствен­но-случайном повторном отборе: п = t2s2/D2.
 Неизвестное значение t найдем из соотношения 2Ф0(t) = g 2Ф0(t) = 0,95; Ф0(t)= 0,95/2 = 0,475.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.
 Следовательно, t = 1,96.
 Рассчитаем необходимую численность выборки
 Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
 Следовательно, надо обследовать не менее 113 слу­жащих.
 Ответ. Чтобы с вероятностью 0,95 и D = 0,50 года с помощью собственно-случайного повторного отбо­ра определить средний стаж работы в фирме, необ­ходимо обследовать не менее 113 служащих.
 2) Дано: D = 0,05; ? = 0,30; g= 0,90.
 По условию задачи требуется найти необходимую численность выборки для доли при собственно-слу­чайном повторном отборе.
 Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-случайном повторном отборе:
 Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.
 По таблице функции Лапласа (приложение 2) най­дем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45. Следовательно, t = 1,64.
 Рассчитаем необходимую численность выборки:
 Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
 Следовательно, п ? 226.
 Ответ. Чтобы с вероятностью 0,90 и ошибкой D=0,05 с помощью собственно-случайного повтор­ного отбора определить долю женщин во всем кол­лективе фирмы, необходимо обследовать не менее 226 служащих.
 Пример 3. Владелец автостоянки опасается об­мана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем авто­стоянки проведено 40 проверок. По данным прове­рок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа — 10 автомобилей. Считая отбор собственно-случай­ным, с вероятностью 0,99 оцените с помощью дове­рительного интервала истинное среднее число авто­мобилей, оставляемых на ночь на охрану. Обосно­ваны ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?
 Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Очевидно, что отбор — бесповторный, так как не имеет смысла производить проверку бо­лее 1 раза в сутки. Объем выборки n = 40, что боль­ше 30 единиц, т. е. выборка большая. Объем гене­ральной совокупности N = 365.
 Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней.
 По условию
 Х-= 400; s = 10; п = 40; g= 0,99; N=365. Используем формулу
 Найдем t из соотношения 2Ф (t) = g. 2Ф0(t) = 0,99; Ф0(t) = 0,99/2 = 0,495.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,495. Ф0(2,58) = 0,495.
 Следовательно, t = 2,58.
 Найдем предельную ошибку выборки:
 Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца.
 Пример 4. В 24 из 40 проверок число автомоби­лей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интер­вал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.
 Решение. Определим границы доверительного интервала для доли дней в течение года, когда чис­ло оставляемых на стоянке автомобилей не превы­шало 400 единиц.
 По условию т = 24; п = 40; g =.0,98.
 Выборочная доля ? = 24/40 = 0,60. Так как
 то найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,98; Ф0(t) = 0,98/2 = 0,49.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,49. Ф0(2,33) = 0,49.
 Следовательно, t = 2,33.
 Найдем предельную ошибку выборки:
 Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703.
 Пример 5. Изменим условие примера 3.
 С помощью собственно-случайного бесповторно­го отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по вы­борке за истинное, совершается погрешность, не пре­вышающая 3 автомобилей, если среднее квадратическое отклонение s равно 10 автомобилям?
 Решение. Дано: D= 3; ? = 10; g= 0,95; N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе;
 Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0,475.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.
 Следовательно, t = 1,96.
 Рассчитаем объем выборки:
 Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
 Следовательно, необходимо провести не менее 39 проверок.
 Ответ. Для определения среднего числа автомо­билей, оставляемых на ночь на охрану с вероятностью 0,95 и D = 3, необходимо провести не менее 39 проверок.
 Пример 6. Изменим условие примера 4.
 Каким должен быть объем собственно-случайной бесповторной выборки, чтобы с вероятностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли дней от доли дней в тече­ние года (когда среднее число оставляемых на ох­рану автомобилей не превышало 400 единиц) не превышало 0,10, если по данным прошлых прове­рок выборочная доля таких дней составляла 0,60?
 Решение. Дано: ? = 0,10; ? = 0,60; g= 0,90; N=365. Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-слу­чайном бесповторном отборе
 Найдем t из соотношения 2Ф0(t) = у. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.
 По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.
 Следовательно, t = 1,64.
 Рассчитаем необходимую численность выборки:
 Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.
 Следовательно, n » 55.
 Ответ. Для того чтобы с вероятностью 0,90 и пре­дельной ошибкой 0,10 с помощью собственно-случайного бесповторного отбора определить искомую долю дней в течение года, необходимо провести не менее 55 проверок.
 Пример 7. Служба контроля энергосбыта прове­ла выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помо­щью собственно-случайного отбора выбрано 10 квар­тир и определен расход электроэнергии в течение одного из летних месяцев (кВт · ч): 125; 78; 102;
 140; 90; 45; 50;125; 115;112.
 С вероятностью 0,95 определите доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме при условии, что в доме 70 квартир, а отбор был: а) повторным; б) бес­повторным.
 Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Объем выборки n = 10 единиц, т. е. выборка малая.
 а) Считая отбор повторным, найдем доверитель­ный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме, т. е. грани­цы доверительного интервала для оценки генераль­ной средней.
 Для этого используем формулы:
 Для определения границ доверительного интер­вала необходимо рассчитать выборочные среднюю и среднее квадратическое (стандартное) отклонение.
 Рассчитаем выборочную среднюю арифметическую:
 Найдем исправленную выборочную дисперсию:
 Найдем исправленное выборочное среднее квадратическое отклонение
 Итак, дано: Х. = 98,2; s= 32,1448; п = 10; у= 0,95. По таблице Стьюдента (приложение 5) найдем t по уровню значимости ? и числу степеней свободы k.
 ? = 1 - ?= 1 - 0,95 = 0,05;
 k=n-1=10-1=9;
 ta=0,05;k=9=2,26
 Найдем предельную ошибку выборки
 Ответ. При условии, что отбор квартир был по­вторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 75,2269 до
 121,1731 кВт.ч.

<< Пред.           стр. 6 (из 19)           След. >>

Список литературы по разделу