<< Пред.           стр. 7 (из 19)           След. >>

Список литературы по разделу

 б) Найдем границы доверительного интервала для оценки среднего расхода электроэнергии на 1 квар­тиру во всем доме, считая отбор бесповторным.
 Для этого используем формулы:
 По условию Х. = 98,2; s = 32,1448;п = 10; g= 0,95;ta=0,05;k=9= 2,26; N = 70.
 Найдем предельную ошибку выборки:
 76,9311 <`X<119,4689.
 Ответ. При условии, что отбор квартир был бес­повторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 76,9311 до 119,4689 кВт ч.
 
 Задачи к теме 7
 1. С целью изучения размеров дневной выручки в сфере мелкого частного бизнеса была произведена 10%-я случайная бесповторная выборка из 1 000 торговых киосков города. В результате были полу­чены данные о средней дневной выручке, которая составила 500 у.е. В каких пределах с доверитель­ной вероятностью 0,95 может находиться средняя дневная выручка всех торговых точек изучаемой совокупности, если среднее квадратическое откло­нение составило 150 у. е.?
 2. Фирма, торгующая автомобилями в неболь­шом городе, собирает информацию о состоянии местного автомобильного рынка в текущем году. С этой целью из 8 746 лиц в возрасте 18 лет и старше, про­живающих в этом городе, отобрано 500 человек. Среди них оказалось 29 человек, планирующих приобрести новый автомобиль в текущем году. Оце­ните долю лиц в генеральной совокупности в возрасте 18 лет и старше, планирующих приобрести но­вый автомобиль в текущем году, если a = 0,05.
 3. Для оценки числа безработных среди рабочих одного из районов города в порядке случайной повторной выборки отобраны 400 человек рабочих спе­циальностей. 25 из них оказались безработными. Используя 95%-й доверительный интервал, оцени­те истинные размеры безработицы среди рабочих этого района.
 4. Туристическое бюро, рекламируя отдых на одном из морских курортов, утверждает, что для этого курорта характерна идеальная погода со среднегодовой температурой +20° С. Пусть случай­но отобраны 35 дней в году. Какова в этом случае вероятность того, что отклонение средней темпера­туры за отобранные дни от среднегодовой темпера­туры не превысит по абсолютной величине 2° С, если температура воздуха распределена по нормальному закону, а стандартное отклонение дневной температуры составляет 4° С ?
 5. Выборочные обследования малых предприя­тий города показали, что 95% малых предприятий в выборке относятся к негосударственной форме собственности. Приняв доверительную вероятность равной 0,954, определите, в каких границах нахо­дится доля негосударственных малых предприятий в генеральной совокупности, если в выборку попа­ло 100 предприятий?
 6. В целях изучения среднедушевого дохода се­мей города в 1995 г. была произведена 1% -я повторная выборка из 30 тыс. семей. По результатам об­следования среднедушевой доход семьи в месяц со­ставил 200 тыс. руб. со средним квадратическим от­клонением, равным 150 тыс. руб. С вероятностью 0,95 найдите доверительный интервал, в котором на­ходится величина среднедушевого дохода всех семей города, считая среднедушевой доход случайной ве­личиной, распределенной по нормальному закону.
 7. Для изучения различных демографических характеристик населения выборочно обследовано 300 семей города. Оказалось, что среди обследован­ных семей 15% состоят из 2 человек. В каких пре­делах находится в генеральной совокупности доля семей, состоящих из 2 человек, если принять доверительную вероятность равной 0,95?
 8. По данным выборочных обследований в 1995 г. прожиточный минимум населения Северо-Кавказ­ского района составил в среднем на душу населе­ния 87 тыс. руб. в месяц. Каким должен был быть минимально необходимый объем выборки, чтобы с вероятностью 0,997 можно было утверждать, что этот показатель уровня жизни населения в выбор­ке отличается от своего значения в генеральной совокупности не более чем на 10 тыс. руб., если сред­нее квадратическое отклонение принять равным 30 тыс. руб.?
 9. В 1995 г. выборочное обследование распреде­ления населения города по среднедушевому денежному доходу показало, что 40% обследованных в выборке имеют среднедушевой денежный доход не более 200 тыс. руб. В каких пределах находится доля населения, имеющего такой среднедушевой доход, во всей генеральной совокупности, если объем генеральной совокупности составляет 1 000 000 единиц, выборка не превышает 10% объе­ма генеральной совокупности и осуществляется по методу собственно-случайного бесповторного отбо­ра, а доверительная вероятность принимается рав­ной 0,954?
 10. Аудиторская фирма хочет проконтролиро­вать состояние счетов одного из коммерческих бан­ков. Для этого случайно отбираются 50 счетов. По 20 счетам из 50. отобранных имело место движе­ние денежных средств в течение месяца. Построй­те 99%-й доверительный интервал, оценивающий долю счетов в генеральной совокупности, по кото­рым имело место движение денежных средств в течение месяца.
 11. Строительная компания хочет оценить воз­можности успешного бизнеса на рынке ремонтностроительных работ. Эта оценка базируется на слу­чайной бесповторной выборке, в соответствии с ко­торой из 1 000 домовладельцев, собирающихся ре­монтировать или перестраивать свои дома, отобра­ны 600 человек. По этой выборке определено, что средняя стоимость строительных работ, которую предполагает оплатить отдельный домовладелец, составляет 5 000 у. е. С какой вероятностью можно гарантировать, что эта стоимость будет отличаться от средней стоимости строительных работ в гене­ральной совокупности по абсолютной величине не более, чем на 100 у. е., если стандартное отклоне­ние стоимости строительных работ в выборке со­ставило 500 у. е.?
 12. Менеджер компании, занимающейся прока­том автомобилей, хочет оценить среднюю величину пробега одного автомобиля в течение месяца. Из 280 автомобилей, принадлежащих компании, методом случайной бесповторной выборки отобрано 30. По данным этой выборки установлено, что средний пробег автомобиля в течение месяца составляет 1 342 км со стандартным отклонением 227 км. Считая про­бег автомобиля случайной величиной, распределен­ной по нормальному закону, найдите 95%-й доверительный интервал, оценивающий средний про­бег автомобилей всего парка в течение месяца.
 13. Среднемесячный бюджет студентов в коллед­жах одного из штатов США оценивается по случайной выборке. С вероятностью 0,954 найдите наи­меньший объем выборки, необходимый для такой оценки, если среднее квадратическое отклонение предполагается равным 100 у. е., а предельная ошибка средней не должна превышать 20 у. е.
 14. Коммерческий банк, изучая возможности предоставления долгосрочных кредитов населению, опрашивает своих клиентов для определения сред­него размера такого кредита. Из 9 706 клиентов бан­ка опрошено 1 000 человек. Среднее значение необ­ходимого кредита в выборке составило 6 750 у. е. со стандартным отклонением 1 460 у. е. Найдите границы 95%-го доверительного интервала для оцен­ки неизвестного среднего значения кредита в гене­ральной совокупности.
 15. Выборочные обследования показали, что доля покупателей, предпочитающих новую модификацию товара А, составляет 60% от общего числа покупа­телей данного товара. Каким должен быть объем выборки, чтобы можно было получить оценку гене­ральной доли с точностью не менее 0,05 при дове­рительной вероятности 0,90?
 16. С помощью случайной выборки оценивается среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 ч. Каким должен быть объем выборки в этом случае, если в предыдущих выборочных обследова­ниях стандартное отклонение времени просмотра передач составило 40 мин, а отклонение выбороч­ной средней от генеральной средней по абсолютной величине не должно превышать 5 мин с вероятнос­тью 0,99?
 17. При выборочном опросе 1200 телезрителей оказалось, что 456 из них регулярно смотрят программы телеканала НТВ. Постройте 99%-й доверительный интервал, оценивающий долю всех телезрителей, предпочитающих программы телеканала НТВ.
 18. Для оценки остаточных знаний по общеэконо­мическим предметам были протестированы 25 студентов 2-го курса факультета. Получены следую­щие результаты в баллах: 107, 90, 114, 88, 117, 110, 103, 120, 96, 122, 93, 100, 121, 110, 135, 85, 120, 89, 100, 126, 90, 94, 99, 116, 111. По этим данным найдите 95%-й доверительный интервал для оценки среднего балла тестирования всех студен­тов 2-го курса факультета.
 19. Для изучения размера среднемесячной зара­ботной платы занятого населения региона производится случайная повторная выборка. Каким дол­жен быть объем этой выборки, чтобы с доверитель­ной вероятностью 0,997 можно было утверждать, что среднемесячная заработная плата в выборке отличается от среднемесячной заработной платы работников во всем регионе по абсолютной величи­не не более чем на 25%, если среднемесячная зара­ботная плата в выборке составила 220 у. е. со сред­ним квадратическим отклонением 120 у. е.?
 20. Выборочное исследование деятельности ком­мерческих банков региона показало, что в среднем каждый банк имеет 10 филиалов в регионе (со стан­дартным отклонением, равным 5). Найдите объем выборки, позволивший сделать такую оценку, если предельная ошибка выборочной средней находится в пределах 20% от ее фактического значения, а до­верительная вероятность составляет 0,95.
 
 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
 В процессе статистического анализа иногда быва­ет необходимо сформулировать и проверить предпо­ложения (гипотезы) относительно величины незави­симых параметров или закона распределения изуча­емой генеральной совокупности (совокупностей). На­пример, исследователь выдвигает гипотезу о том, что «выборка извлечена из нормальной генеральной со­вокупности» или «генеральные средние двух анали­зируемых совокупностей равны». Такие предполо­жения называются статистическими гипотезами.
 Сопоставление высказанной гипотезы относи­тельно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количе­ственной оценкой степени достоверности получа­емого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.
 Выдвинутая гипотеза называется нулевой (ос­новной). Ее принято обозначать Н0.
 По отношению к высказанной (основной) гипо­тезе всегда можно сформулировать альтернатив­ную (конкурирующую), противоречащую ей. Аль­тернативную (конкурирующую) гипотезу принято обозначать Н1 .
 Цель статистической проверки гипотез состо­ит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипо­тезы Н0
 Если выдвигаемая гипотеза сводится к утверж­дению о том, что значение некоторого неизвестно­го параметра генеральной совокупности в точнос­ти равно заданной величине, то эта гипотеза на­зывается простой, например: «Среднедушевой сово­купный доход населения России составляет 650 руб. в месяц»; «Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%». В других случаях гипотеза называется сложной.
 В качестве нулевой гипотезы Н0 принято выдви­гать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.
 По своему содержанию статистические гипотезы можно подразделить на несколько основных типов*:
 — гипотезы о виде закона распределения иссле­дуемой случайной величины;
 — гипотезы о числовых значениях параметров исследуемой генеральной совокупности**;
 — гипотезы об однородности двух или несколь­ких выборок или некоторых характеристик анали­зируемых совокупностей;
 — гипотезы об общем виде модели, описываю­щей статистическую зависимость между признака­ми; и др.
 * В этой работе рассматриваются первые два типа гипотез.
 ** Эти гипотезы часто называют параметрическими, тогда как все остальные — непараметрическими.
 
 Так как проверка статистических гипотез осу­ществляется на основании выборочных данных, т. е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неиз­бежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.
 Так, в какой-то небольшой доле случаев ? нуле­вая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной сово­купности она является справедливой. Такую ошиб­ку называют ошибкой 1-го рода, а ее вероятность — 1 уровнем значимости и обозначают ?.
 Наоборот, в какой-то небольшой доле случаев b нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибоч­на, а справедлива альтернативная гипотеза Н1. Такую ошибку называют ошибкой 2-го рода. Вероят­ность ошибки 2-го рода обозначается как b. Вероятность 1 - b называют мощностью критерия.
 При фиксированном объеме выборки можно выб­рать по своему усмотрению величину вероятности только одной из ошибок ? или b. Увеличение веро­ятности одной из них приводит к снижению дру­гой. Принято задавать вероятность ошибки 1-го рода a — уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня зна­чимости a: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тог­да, очевидно, из двух критериев, характеризующих­ся одной и той же вероятностью a (отклонить правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая ошиб­ка 2-го рода b, т.е. большая мощность. Снижения вероятностей обеих ошибок a и b можно добиться путем увеличения объема выборки.
 Правильное решение относительно нулевой ги­потезы Н0 также может быть двух видов:
 — будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0 ; вероятность такого решения 1 - a;
 — нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, когда в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтер­нативной Н1, вероятность такого решения 1 - b — мощность критерия.
 Результаты решения относительно нулевой гипо­тезы можно проиллюстрировать с помощью табл. 8.1.
 Таблица 8.1
 Нулевая гипотеза Н0
  Результаты решения относительно нулевой гипотезы Н0
 
 Отклонена
  Принята
 
 ВернаОшибка 1-го рода, ее вероятность
 Р(Н1/Н0) = aПравильное решение, его вероятность Р(Н0/Н0) = 1 - a
 НевернаПравильное решение, его вероятность Р(Н1/Н1) = 1 - bОшибка 2-го рода, ее вероятность
 Р(Н0/Н0) = b
 
 
 Проверка статистических гипотез осуществляет­ся с помощью статистического критерия (назо­вем его в общем виде К), являющего функцией от результатов наблюдения.
 Статистический критерий — это правило (фор­мула), по которому определяется мера расхожде­ния результатов выборочного наблюдения с выс­казанной гипотезой Н0.
 Статистический критерий, как и всякая функ­ция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н0 подчинен некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения
 f(k).
 Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользу­ются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощ­ный среди всех возможных критериев. Суть его сво­дится к выбору такого критерия К с известной фун­кцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровне значимос­ти ? можно было бы найти критическую точку К распределения f(k), которая разделила бы область значений критерия на две части: область допусти­мых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты вы­борочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.
 Если такой критерий К выбран, и известна плот­ность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости ? рассчитать по выбо­рочным данным наблюдаемое значение критерия Kнабл определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой ги­потезы Н0.
 Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона x2; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей — с помощью критерия Фише­ра F; ряд гипотез о неизвестных значениях пара­метров генеральных совокупностей проверяется с помощью критерия Z — нормальной распределен­ной случайной величины и критерия t-Стьюдента и т. д.
 Значение критерия, рассчитываемое по специ­альным правилам на основании выборочных дан­ных, называется наблюдаемым значением критерия(Kнабл).
 Значения критерия, разделяющие совокупность значений критерия на область допустимых значе­ний (наиболее правдоподобных в отношении нуле­вой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении ну­левой гипотезы Н0), определяемые на заданном уровне значимости ? по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками (Ккр ).
 Областью допустимых значений (областью при­нятия нулевой гипотезы Н0) называют совокуп­ность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.
 Критической областью называют совокупность значений критерия К, при которых нулевая гипо­теза Н0 отклоняется в пользу конкурирующей Н1.
 Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические об­ласти.
 Если конкурирующая гипотеза — правосторон­няя, например, Н1: а > a0, то и критическая область — правосторонняя (рис. 8.1). При правосто­ронней конкурирующей гипотезе критическая точка (Ккр.п) принимает положительные значения.
 Если конкурирующая гипотеза — левосторонняя, например, Н1 : а < а0, то и критическая область — левосторонняя (рис. 8.2). При левосторонней кон­курирующей гипотезе критическая точка принимает отрицательные значения (Ккр.л).
 Если конкурирующая гипотеза — двусторонняя, например. Н1: а ? а0 , то и критическая область — двусторонняя (рис. 8.3). При двусторонней конку­рирующей гипотезе определяются 2 критические точки (Ккр.л и K кр..п)
 Основной принцип проверки статистических гипотез состоит в следующем:
 — если наблюдаемое значение критерия (Кнабл) принадлежит критической области, то нулевая ги­потеза Н0 отклоняется в пользу конкурирующей H1;
 — если наблюдаемое значение критерия (Кнабл) принадлежит области допустимых значений, то нулевую гипотезу Н0 нельзя отклонить.
 Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого (Кнабл) и критического значений критерия (Ккр. ).
 При правосторонней конкурирующей гипотезе:
 — если Кнабл?Ккр. , то нулевую гипотезу Н0нельзя отклонить;
 — если Кнабл > Kкр , то нулевая гипотеза Н0 откло­няется в пользу конкурирующей Н1.
 При левосторонней конкурирующей гипотезе:
 — если Кнабл?-Ккр, то нулевую гипотезу Н0 нельзя отклонить;
 — если Кнабл < -Ккр , то нулевая гипотеза Н0 от­клоняется в пользу конкурирующей Н1.
 При двусторонней конкурирующей гипотезе:
 — если -Ккр ? Кнабл? Ккр, то нулевую гипотезу Н0 нельзя отклонить;
 — если Кнабл > Ккр или Кнабл < -Ккр, то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.
 
 Алгоритм проверки статистических гипотез сводится к следующему:
 1) сформулировать нулевую Н0 и альтернатив­ную Н1 гипотезы;
 2) выбрать уровень значимости ?;
 3) в соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е. — специально подобранную слу­чайную величину К, точное или приближенное распределение которой заранее известно;
 4) по таблицам распределения случайной вели­чины К, выбранной в качестве статистического критерия, найти критическое значение Ккр (критиче­скую точку или точки);
 5) на основании выборочных данных по специ­альному алгоритму вычислить наблюдаемое значе­ние критерия Кнабл;
 6) по виду конкурирующей гипотезы Н1 опреде­лить тип критической области;
 7) определить, в какую область (допустимых зна­чений или критическую) попадает наблюдаемое значение критерия Кнабл , и в зависимости от этого — принять решение относительно нулевой гипотезы
 Н0
  Следует заметить, что даже в том случае, если нулевую гипотезу Н0 , нельзя отклонить, это не означает, что высказанное предположение о генераль­ной совокупности является единственно подходя­щим: просто ему не противоречат имеющиеся вы­борочные данные, однако таким же свойством на­ряду с высказанной могут обладать и другие гипо­тезы.
 Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:
 — если в результате проверки нулевую гипотезу Н0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточ­ной уверенностью отклонить нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 больше a, а кон­курирующей Н1 — меньше 1 - a;
 — если в результате проверки нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1, то имеющиеся выборочные данные не позволяют с до­статочной уверенностью принять нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 меньше a, а конкурирующей Н1 — больше 1 - a.
 Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определи­те, случайно ли это, или в фирме «А» работает ос­ведомитель фирмы-конкурента?
 Решение. Для того чтобы ответить на поставлен­ный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?
 Если ходы, предпринимаемые конкурентом, вы­бираются случайно, т. е. в фирме «А» — нет осведомителя (инсайдера), то число «правильных» и «не­правильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличитель­ная особенность равномерного распределения.
 Этот вид статистических гипотез относится к гипотезам о виде закона распределения генераль­ной совокупности.
 Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.
 Н0 : Х ~ R(a; b) — случайная величина Х подчи­няется равномерному распределению с параметра­ми (a; b) (в контексте задачи — «В фирме «А» — нет осведомителя (инсайдера)»; «Распределение чис­ла удачных ходов фирмы-конкурента — случайно»);
 Н1 : случайная величина Х не подчиняется рав­номерному распределению (в контексте задачи — «В фирме «А» — есть осведомитель (инсайдер)»;
 «Распределение числа удачных ходов фирмы-кон­курента — неслучайно»).
 В качестве критерия для проверки статистичес­ких гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина c2 . Этот критерий называют критерием Пирсона.
 Его наблюдаемое значение (c2набл) рассчитывает­ся по формуле
 где m(эмп)i — эмпирическая частота i-й группы вы­борки; т(теор)i, — теоретическая частота i-й группы выборки.
 Составим таблицу распределения эмпирических и теоретических частот (табл. 8.2).
 Таблица 8.2
 m(эмп)i
  7
  3
 
 т(тeop)i
  5
  5
 
 
 
 Найдем наблюдаемое значение c2набл
 Критическое значение (c2кр.) следует определять с помощью таблиц распределения c2 (приложение 4) по уровню значимости ? и числу степеней свободы k.
 По условию a = 0,05, а число степеней свободы рассчитывается по формуле
 k = п - l - 1,
 где k — число степеней свободы; п — число групп выборки; l — число неизвестных параметров предполагаемой модели, оцениваемых по данным вы­борки (если все параметры предполагаемого закона известны точно, то l = 0).
 По условию задачи, число групп выборки (п) рав­но 2, так как могут быть только 2 варианта дей­ствий фирмы-конкурента: «удачные» и «неудач­ные», а число неизвестных параметров равномер­ного распределения (l) равно 0.
 Отсюда k=2-0-l=l.
 Найдем c2кр. по уровню значимости a = 0,05 и числу степеней свободы k = 1:
 c2кр(a =0,05 ;k=1). =3.8
 c2набл. < c2кр.следовательно, на данном уровне зна­чимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических час­тот — незначимые. Данные наблюдений согласуют­ся с гипотезой о равномерном распределении гене­ральной совокупности.
 Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости a = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
 Ответ. На уровне значимости a = 0,05 можно ут­верждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
 Пример 2. На уровне значимости a = 0,025 про­верить гипотезу о нормальном распределении генеральной совокупности, если известны эмпиричес­кие и теоретические частоты (табл. 8.3):
 Таблица 8.3
 m(эмп)i
  5
  10
  20
  25
  14
  3
 
 т(теор)i
  6
  14
  28
  18
  8
  3
 
 
 
 Решение. Сформулируем нулевую и конкуриру­ющую гипотезы согласно условию задачи.
 Н?: Х ~ N(a; s2) — случайная величина Х подчи­няется нормальному закону распределения с параметрами а и s2.
 Н1. случайная величина Х не подчиняется нор­мальному закону распределения с параметрами а и s2.
 В качестве критерия для проверки нулевой ги­потезы используем критерий Пирсона c2 .
 Найдем наблюдаемое значение (c2 набл):
 Найдем критическое значение критерия (c2кр ) по таблице распределения c2 (приложение 4) по уровню значимости ? и числу степеней свободы k.
 По условию ? = 0,025; число степеней свободы найдем по формуле
 k = п — I - 1,
 где k — число степеней свободы;
 п — число групп выборки;
 I — число неизвестных параметров предполагае­мой модели, оцениваемых по данным выборки.
 По условию задачи число групп выборки (п) рав­но 6, а число параметров нормального неизвестных распределения (I) равно 2.
 Отсюда k=6-2-1=3.
 Найдем c2кр по уровню значимости a = 0,025 и числу степеней свободы k = 3:
 c2кр(a=0,025;k=3) =9,4
 
 c2набл > c2кр следовательно, на данном уровне зна­чимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и те­оретических частот — значимые. Данные наблюде­ний не согласуются с гипотезой о нормальном рас­пределении генеральной совокупности.
 Ответ. На уровне значимости a = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
 Пример 3. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения вре­мени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции `X = 42 с. Можно ли по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если: а) исправленное выбороч­ное среднее квадратическое отклонение s —3,5 с; б) выборочное среднее квадратическое отклонение s— 3,5 с?
 Решение. а) Для решения данной задачи необхо­димо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точ­но равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).
 Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.
 H0: а = a0 = 40 — неизвестное математическое ожидание а (нормально распределенной генераль­ной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению a0 (применительно к условию данной задачи — вре­мя выполнения технологической операции соответствует норме).
 H1: а > 40 — неизвестное математическое ожи­дание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения a0 (применительно к условию данной задачи — время выполнения технологичес­кой операции больше установленной нормы).
 Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.
 В качестве критерия для сравнения неизвестно­го математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значени­ем a0 используется случайная величина t-критерий Стьюдента.
 Его наблюдаемое значение (tнабл) рассчитывается по формуле
 где X. — выборочная средняя; a0 — числовое значе­ние генеральной средней; s — исправленное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение tнабл
 Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 5) по уровню значимости ? и числу степеней свободы k.
 По условию a = 0,01; число степеней свободы найдем по формуле k = п - 1,
 где k — число степеней свободы; п — объем выборки.
 k = 16 - 1 = 15.
 Найдем tкр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:
 tкр(?=0,01;k=1)=2,6
 Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости ? (для односторонней критичес­кой области) и числу степеней свободы k = п - 1 и присваивать ему знак «минус».
 При двусторонней конкурирующей гипотезе Н1 : а ? 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимо­сти a (для двусторонней критической области) и числу степеней свободы k = п - 1.
 tнабл < tкр , следовательно, на данном уровне значи­мости нет оснований отклонить нулевую гипотезу.
 Ответ. По имеющимся хронометрическим дан­ным на уровне значимости ? = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме. Следова­тельно, жалобы работниц — необоснованны.
 Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.4), следователь­но, нет оснований отклонить нулевую гипотезу.
 б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.
 Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение tнабл рассчитывается по формуле
 где X0— выборочная средняя; а0 — числовое значе­ние генеральной средней; sвыб — выборочное среднее квадратическое отклонение; л — объем выборки. Найдем наблюдаемое значение (tнабл)
 Критическое значение (tкр) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости ? и числу степеней свободы k.
 tнабл < tкр , следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц — необоснованны.
 Ответ. По имеющимся хронометрическим дан­ным на уровне значимости a = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме, жалобы работниц — необоснованны.
 Пример 4. Изменим условие предыдущей зада­чи. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологичес­кой операции на конвейере по производству ча­сов. От работающих поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки данной жалобы про­изведены хронометрические измерения времени ее выполнения у 36 работниц, занятых на этой опе­рации, и получено среднее время выполнения операции X0 = 42 с. Можно ли (предполагая время выполнения технологической операции случайной величиной, подчиняющейся нормальному закону) по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если известно, что среднее квад­ратическое отклонение генеральной совокупности s составляет 3,5 с?
 Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна числовому значению, когда дисперсия генеральной совокупности известна (большая выбор­ка, так как п = 36 больше 30).
 Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.
 Н0 : а = a0 = 40 — неизвестная генеральная сред­няя нормально распределенной совокупности с известной дисперсией равна числовому значению (при­менительно к условию данной задачи — время вы­полнения технологической операции соответствует норме).
 Н1: а > 40 — неизвестная генеральная средняя нормально распределенной совокупности с извест­ной дисперсией больше числового значения (при­менительно к условию данной задачи — время вы­полнения технологической операции больше уста­новленной нормы).
  Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.
 В качестве критерия для сравнения выборочной бедней с гипотетической генеральной средней нормальной совокупности, когда дисперсия генеральной совокупности известна, используется случайная величина U.
 Его наблюдаемое значение (uнабл) рассчитывается по формуле
 где X.— выборочная средняя; а0 — числовое значе­ние генеральной средней; sген — выборочное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение (инабл):
 Так как конкурирующая гипотеза — правосто­ронняя, критическое значение и следует находить по таблице функции Лапласа (приложение 2) из равенства
 ф0(икр) = (1 - 2a)/2.
 По условию a = 0,01.
 Отсюда
 Ф0(икр) = (1 - 2·0,01)/2 = 0,49.
 По таблице функции Лапласа (приложение 2) найдем, при каком икр Ф0(икр) = 0,49.
 Ф0(2,33) = 0,49.
 Следовательно, икр = 2,33.
 Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a)/2 и присваивать ему знак «минус».
 При двусторонней конкурирующей гипотезе Н1 : а ? 40 икр следует находить по таблице функции Лапласа (приложение 2) из равенства
 инабл >uкр , следовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. По имеющимся хронометрическим данным с более чем 99%-й надежностью можно ут­верждать, что среднее время выполнения этой опе­рации превышает норму. Следовательно, жалобы работниц — обоснованны.
 Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.5), следовательно, нуле­вая гипотеза отвергается в пользу конкурирующей.
 Ответ. По имеющимся хронометрическим дан­ным на уровне значимости a = 0,01 можно утверждать, что среднее время выполнения этой опера­ции превышает норму, жалобы работниц — обо­снованны.
 Пример 5. Экономический анализ производитель­ности труда предприятий отрасли позволил выдвинуть гипотезу о наличии 2 типов предприятий с раз­личной средней величиной показателя производительности труда. Выборочное обследование 42 пред­приятий 1-й группы дало следующие результаты: средняя производительность труда X.— 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда ? — 107 деталей. Генеральные дисперсии из­вестны: D(X) = 126,91 (дет.2); D(Y) = 136,1 (дет.2). Считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y, на уровне значимости 0,05, проверьте, случайно ли по­лученное различие средних показателей произво­дительности труда в группах или же имеются 2 ти­па предприятий с различной средней величиной про­изводительности труда.
 Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выбор­ки). В данной задаче речь идет о больших выборках, так как пx = 42 и пy =35 больше 30. Выборки — независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генераль­ных совокупностей.
 Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.
 Н0: `X = `Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи — предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах — одинакова).
 Н1: `X ?`Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию дан­ной задачи — предприятия 2 групп относятся к разному типу предприятий: средняя производитель­ность труда в 2 группах — неодинакова).
 Выдвигаем двустороннюю конкурирующую ги­потезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше произво­дительность труда в одной из групп предприятий по сравнению с другой.
 Поскольку конкурирующая гипотеза — двусто­ронняя, то и критическая область — двусторонняя.
 В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), исполь­зуется случайная величина Z.
 Его наблюдаемое значение (zнабл) рассчитывается по формуле
 где X.— выборочная средняя для X; ?— выбороч­ная средняя для Y; D(X) — генеральная дисперсия для X; D(Y) — генеральная дисперсия для Y; пx — объем выборки для X; пy — объем выборки для Y. Найдем наблюдаемое значение (zнабл):
 Так как конкурирующая гипотеза — двусторонняя, критическое значение (zкр ) следует находить по таблице функции Лапласа (приложение 2) из ра­венства
 Ф0(zкр) = (1 - a)/2.
 По условию a= 0,05.
 Отсюда
 Ф0(zкр)=(1-0,05)/2=0,475.
 По таблице функции Лапласа (приложение 2) найдем, при каком zкрФ0(zкр) = 0,475.
 Ф0(1,96) = 0,475.
 Учитывая, что конкурирующая гипотеза — дву­сторонняя, находим две критические точки:
 Заметим, что при левосторонней конкурирующей гипотезе Н1:`X < `Y zкр следует находить по табли­це функции Лапласа (приложение 2) из равенства Ф0(zкр ) = (1 - 2a)/2 и присваивать ему знак «минус».
 При правосторонней конкурирующей гипотезе Н1: `X > `Y zкр находим по таблице функции Лапла­са (приложение 2) из равенства Ф0(zкр)= (1- 2a)/2.
 zнабл> zкрследовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости a= 0,05 мож­но утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с раз­личной средней величиной производительности труда.
 Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.6), следовательно, нуле­вая гипотеза отклоняется в пользу конкурирующей.
 Ответ. На уровне значимости a = 0,05 можно ут­верждать, что полученное различие средних показателей производительности труда в группах не­ случайно, имеются 2 типа предприятий с различ­ной средней величиной производительности труда.
 Пример 6. Предполагается, что применение но­вого типа резца сократит время обработки некото­рой детали. Хронометраж времени обработки 9 де­талей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали X.— 57 мин, исправленная выборочная дисперсия s2x = 186,2 (мин2). Среднее время обработки 15 дета­лей, обработанных новым типом резцов, - ? по данным хронометражных измерений — 52 мин, а ис­правленная выборочная дисперсия s2y = 166,4 (мин2). На уровне значимости ? = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов со­кратить время обработки детали?
 Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как пx = 9 и ny = 15 меньше 30. Выборки — независимые, поскольку из контекста задачи видно, что они извле­чены из непересекающихся генеральных совокупностей.
 Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.
 Н0: `X = `Y — генеральные средние 2 нормально распределенных совокупностей с неизвестными дис­персиями (но предполагаемыми одинаковыми) рав­ны (применительно к условию данной задачи — среднее время, затрачиваемое на обработку детали резцами нового и старого типа, — одинаково, т. е. использование нового типа резца не позволяет сни­зить время на обработку детали).
 Н1: `X > `Y — генеральная средняя для Х боль­ше, чем генеральная средняя для Y (применитель­но к условию данной задачи — среднее время, зат­рачиваемое на обработку детали резцами старого типа, больше, чем — нового, т. е. использование но­вого типа резца позволяет снизить время на обра­ботку детали).
 Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.
 Приступать к проверке гипотезы о равенстве ге­неральных средних 2 нормально распределенных совокупностей с неизвестными дисперсиями мож­но лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в тео­рии неразрешима.
 Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных диспер­сий нормальных совокупностей.
 Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.
 Н0: D(X) = D(Y) — генеральные дисперсии 2 нор­мально распределенных совокупностей равны.
 Н1: D(X) > D(Y) — генеральная дисперсия для Х больше генеральной дисперсии для Y. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для Х значительно больше, чем исправленная выборочная дис­персия для Y.
 Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.
 В качестве критерия для сравнения 2 дисперсий нормальных генеральных совокупностей используется случайная величина F — критерий Фишера-Снедекора (приложение 6).
 Его наблюдаемое значение (fнабл) рассчитывается по формуле
 где s2б — большая (по величине) исправленная вы­борочная дисперсия; s2м — меньшая (по величине) исправленная выборочная дисперсия.
 Найдем fнабл
 Критическое значение (fкр)следует находить с помощью таблицы распределения Фишера-Снедекора (приложение 6) по уровню значимости a и числу степеней свободы k1 и k2.
 По условию a = 0,01; число степеней свободы найдем по формуле
 k1= n1 - 1; k2 = n2 - 1,
 где k1 — число степеней свободы большей (по вели­чине) исправленной дисперсии; k2 — число степе­ней свободы меньшей (по величине) исправленной дисперсии; п1 — объем выборки большей (по величине) исправленной дисперсии; n2 — объем выбор­ки меньшей (по величине) исправленной дисперсии. Найдем k1 и k2
 k1 = 10 - 1 = 9;
 k2=15 - 1 = 14.
 Определяем fкр по уровню значимости a = 0,01 и числу степеней свободы k1 =9 и k2=14 :
 fнабл< fкр следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипоте­зу о равенстве генеральных дисперсий нормальных совокупностей.
 Следовательно, можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.
 В качестве критерия для проверки этой гипоте­зы используется случайная величина t-критерий Стьюдента.
 Его наблюдаемое значение (tнабл ) рассчитывается по формуле
 где X.— выборочная средняя для X;?— выбороч­ная средняя для Y; s2x — «неправленная» выбороч­ная дисперсия для X; s2y — «неправленная» выбо­рочная дисперсия для Y; пx — объем выборки, из­влеченной из генеральной совокупности X; пy — объем выборки, извлеченной из генеральной сово­купностиY. Найдем tнабл,
 Критическое значение (tкр ) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости a и числу степеней свободы k.
 По условию a = 0,01; число степеней свободы найдем по формуле
 k = пx + ny - 2,
 где k — число степеней свободы; пx — объем выбор­ки для X; пy — объем выборки для Y.
 k = 9 + 15 - 2 = 22.
 Найдем t кр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 22
 Заметим, что при левосторонней конкурирующей гипотезе `X < `Y tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уров­ню значимости ? (для односторонней критической области) и числу степеней свободы k = пx + пy — 2 и присваивать ему знак «минус».
 При двусторонней конкурирующей гипотезе `X ?`Y tкр находим по таблицам распределения Стьюдента приложение 5) по уровню значимости ? (для двусторонней критической области) и числу степеней свободы k= пx+ пy - 2.
 tнабл < tкр , следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся хронометрическим данным на уров­не значимости a = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов, отличается незначимо, рас­хождения между средними — случайны, использо­вание нового типа резцов не позволяет снизить вре­мя обработки детали.
 Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.7), следователь­но, нулевую гипотезу нельзя отклонить.
 Ответ. На уровне значимости a = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.
 Пример 7. Партия изделий принимается в том случае, если вероятность того, что изделие окажет­ся соответствующим стандарту, составляет не ме­нее 0,97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости a = 0,02 принять партию?
 Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная гене­ральная доля точно равна определенному числу.
 Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.
 Н1: р =р0 = 0,97 — неизвестная генеральная доля р равна р0 (применительно к условию этой задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0,97, т. е. партию изделий можно принять).
 Н1: р < 0,97 — неизвестная вероятность р мень­ше гипотетической вероятности p0 (применительно к условию данной задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0,97, т. е. партию из­делий нельзя принять).
 Так как конкурирующая гипотеза — левосторон­няя, то и критическая область — левосторонняя.
 В качестве критерия для сравнения наблюдае­мой относительной частоты с гипотетической вероятностью появления события используется случай­ная величина U.
 Его наблюдаемое значение (uнабл) рассчитывается по формуле
 где т/п — относительная частота (частость) появ­ления события;p0 — гипотетическая вероятность появления события; q0 — гипотетическая вероят­ность непоявления события; п — объем выборки.

<< Пред.           стр. 7 (из 19)           След. >>

Список литературы по разделу