<< Пред.           стр. 5 (из 19)           След. >>

Список литературы по разделу

 
 Отсюда
 Решим систему линейных уравнений:
 Среднеожидаемый вес случайно отобранной туши составляет 950 кг. Среднее квадратическое отклонение веса туш — 150 кг.
 Ответ. а = 950; s= 150.
 Пример 5. В очередной раз изменим условие задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределения, с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонени­ем. Каким должно быть среднее квадратическое (стандартное) отклонение, чтобы с вероятностью 0,81648 можно было утверждать, что абсолютное отклонение веса случайно отобранной туши от ма­тематического ожидания не превысит 200 кг?
 Решение. По условию задачи а = 950; ? = 200; Р(|Х - 950| < 200) = 0,81648; ? =?
 Используем формулу (5.11) расчета вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания.
 Тогда получим
 По таблице функции Лапласа (приложение 2) най­дем, при каком z = 200/s функция Ф0(z) = 0,40824.
 z = 1,33, т. е. Ф0(1.33) = 0,40824.
 Отсюда
 s=200/1,33=150.
 Чтобы с вероятностью 0,81648 можно было ут­верждать, что абсолютное отклонение веса случай­но отобранной туши от математического ожидания не превысит 200 кг, среднее квадратическое отклонение веса туш должно составлять 150 кг.
 Ответ. 150.
 
 Пример 6. Фирма собирается приобрести партию из 100 000 единиц некоторого товара. Из прошлого опыта известно, что 1 % товаров данного типа име­ют дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1 050 дефектных еди­ниц товара?
 Решение. В качестве случайной величины в дан­ной задаче выступает число дефектных единиц товара в общей партии из 100 000 единиц. Обозначим ее через X.
 Перечислим все возможные значения случайной величины X: 0, 1, 2, ..., 99 999, 100 000.
 Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.
 По условию вероятность того, что единица това­ра окажется дефектной, — постоянна и составляет 0,01 (р = 0,01). Вероятность противоположного со­бытия, т. е. того, что единица товара не имеет дефекта, также постоянна и составляет 0,99:
 q= 1 -p= 1 -0,01 =0,99.
 Все 100 000 испытаний — независимы, т. е. веро­ятность того, что каждая единица товара окажется дефектной, не зависит от того, окажется дефектной или нет любая другая единица товара.
 Значения случайной величины Х — это, в об­щем виде, число появлений интересующего нас со­бытия в 100 000 независимых испытаниях. Поэто­му можно сделать вывод о том, что случайная ве­личина Х — число дефектных единиц товара в об­щей партии из 100 000 единиц — подчиняется би­номиальному закону распределения вероятностей с параметрами п = 100 000 и р = 0,01.
 Итак, по условию задачи n = 100 000; р = 0,01; q = 0,99; X = т.
 Необходимо найти вероятность того, что число дефектных единиц товара окажется в пределах от т1 = 950 до т2 =1 050, т. е. вероятность того, что случайная величина Х = т попадет в интервал от 950 до 1050:
 Р(т1 < т < т2) = ?
 Так как мы имеем дело со случайной величиной, подчиняющейся биномиальному распределению, вероятность появления события т раз в п незави­симых испытаниях необходимо вычислять по фор­муле Бернулли (4.10).
 В данном случае для определения искомой вероят­ности нам необходимо с помощью формулы Бернулли найти P100000, 950 ,РР100000, 951 , РР100000, 952 ..., РР100000,1049
 РР100000,1050 ,а затем сложить их, используя теорему сложения вероятностей несовместных событий.
 Очевидно, что такой способ определения иско­мой вероятности связан с громоздкими вычислени­ями. Так,
 Можно значительно облегчить расчеты, если ап­проксимировать биномиальное распределение нор­мальным, т. е. выразить функции биномиального распределения через функции нормального.
 Когда п — число испытаний в биномиальном эксперименте — возрастает, дискретное биномиаль­ное распределение стремится к непрерывному нор­мальному распределению. Это означает, что для больших п мы можем аппроксимировать биноми­альные вероятности вероятностями, полученными для нормально распределенной случайной величины, имеющей такое же математическое ожидание и такое же среднее квадратическое отклонение.
 Подставим параметры биномиального распреде­ления (5.15) в формулу (5.10) и получим формулу для приближенного расчета вероятности появления события от т1 до т2 раз в п независимых испыта­ниях Р(т1 < т < т2):
 где Ф0(z) — функция Лапласа
 Формулу для вычисления вероятности появле­ния события от т1 до т2 раз в п независимых испытаниях Рn(m1 < т < т2) называют интегральной теоремой Лапласа.
 Использование локальной и интегральной теорем Лапласа дает приближенные значения искомых вероятностей. Погрешность будет невелика при ус­ловии, что npq > 9.
 Для решения данной задачи воспользуемся ин­тегральной теоремой Лапласа:
 
 По таблице функции Лапласа (приложение 2) найдем Ф0(1,59).
 Ф0(1,59) = 0,44408.
 P100000 (950< т < 1 050) » 2 · 0,44408 = 0,88816.
 Вероятность того, что в партии из 100 000 еди­ниц окажется от 950 до 1 050 дефектных единиц товара, составляет 0,88816.
 Данную конкретную задачу можно было решить еще более просто.
 Математическое ожидание числа дефектных еди­ниц товара равно 1 000 единиц:
 М(т) = пр= 100 000 · 0,01 = 1 000.
 Абсолютное отклонение нижней и верхней гра­ниц интервала (т1, т2) от математического ожида­ния М(т) = пр составляет 50 единиц:
 |m1 - пр| = |950 - 100 000 · 0,0l| = 50;
 |m2 - np| = 1 050 - 100 000 · 0,0l| = 50.
 Следовательно, искомую вероятность можно рас­сматривать как вероятность заданного отклонения частоты от своего математического ожидания:
 Р(|т – пр| < ?).
 Подставив параметры биномиального распреде­ления в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета ве­роятности заданного отклонения частоты от своего математического ожидания:
 При использовании этой формулы для решения задачи сразу получим
 Ответ. 0,88816.
 Пример 7. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания метал­ла в каждой пробе не более, чем на 0,05.
 Решение. В отличие от предыдущей задачи, в данном случае речь идет о расчете вероятности заданного отклонения частости (относительной час­тоты) появления события от вероятности его появления в отдельном независимом испытании, т. е.
 При возрастании числа независимых испытаний распределение частости стремится к нормальному распределению точно так же, как и распределение частоты. Это означает, что при больших п мы мо­жем аппроксимировать распределение частости нор­мальным распределением случайной величины, имеющей такое же математическое ожидание и та­кое же среднее квадратическое отклонение.
 Подставив параметры распределения частости в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета вероятности задан­ного отклонения частости от своего математическо­го ожидания (вероятности).
 Параметры распределения частости:
 Используя эти формулы, получим
 Применим данную формулу для решения задачи.
 По условию: n = 400; р = 0,8; q = 1 - 0,8 = 0,2;
 Вероятность того, что доля проб с промышлен­ным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0,05, составляет 0,98758.
 Ответ. 0,98758.
 Задачи к теме 5
 1. Дневная добыча угля в некоторой шахте рас­пределена по нормальному закону с математиче­ским ожиданием 785 т и стандартным отклонени­ем 60 т. Найдите вероятность того, что в опреде­ленный день будут добыты, по крайней мере, 800 т угля. Определите долю рабочих дней, в которые бу­дет добыто от 750 до 850 т угля. Найдите вероят­ность того, что в данный день добыча угля окажет­ся ниже 665 т.
 2. Кандидат на выборах считает, что 20% изби­рателей в определенной области поддерживают его избирательную платформу. Если 64 избирателя слу­чайно отобраны из числа избирателей данной области, найдите вероятность того, что отобранная доля избирателей, поддерживающих кандидата, не бу­дет отличаться по абсолютной величине от истин­ной доли более, чем на 0,07.
 3. Авиакомпания знает, что в среднем 5% лю­дей, делающих предварительный заказ на опреде­ленный рейс, не будет его использовать. Если авиа­компания продала 160 билетов на самолет, в кото­ром лишь 155 мест, чему равна вероятность того, что место будет доступно для любого пассажира, имеющего заказ и планирующего улететь?
 4. Вес тропического грейпфрута, выращенного в Краснодарском крае, — нормально распределен­ная случайная величина с неизвестным математи­ческим ожиданием и дисперсией, равной 0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5 кг. Найдите ожидаемый вес случайно выб­ранного грейпфрута.
 5. Один из методов, позволяющих добиться ус­пешных экономических прогнозов, состоит в применении согласованных подходов к решению конк­ретной проблемы. Обычно прогнозом занимается большое число аналитиков. Средний результат та­ких индивидуальных прогнозов представляет собой общий согласованный прогноз. Пусть этот прогноз относительно величины банковской процентной ставки в текущем году подчиняется нормальному закону со средним значением а = 9% и стандарт­ным отклонением ?= 2,6%. Из группы аналитиков случайным образом отбирается один человек. Най­дите вероятность того, что согласно прогнозу этого аналитика уровень процентной ставки: а) превысит 11%; б) окажется менее 14%; в) будет в пределах от 12 до 15%.
 6. Предположим, что в течение года цена на ак­ции некоторой компании есть случайная величина, распределенная по нормальному закону с матема­тическим ожиданием, равным 48 у. е., и стандарт­ным отклонением, равным 6. Определите вероят­ность того, что в случайно выбранный день обсужда­емого периода цена за акцию была: а) более 60 у. е.; б) ниже 60 за акцию; в) выше 40 за акцию; г) между 40 и 50 у. е. за акцию.
 7. Для поступления в некоторый университет необходимо успешно сдать вступительные экзаме­ны. В среднем их выдерживают лишь 25% абиту­риентов. Предположим, что в приемную комиссию поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы 500 поступающих сдадут все экзамены (наберут проходной балл)?
 8. Средний срок службы коробки передач до ка­питального ремонта у автомобиля определенной марки составляет 56 мес. со стандартным отклоне­нием ? = 16 мес. Привлекая покупателей, производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое число ремонтов коробки передач нового автомобиля в случае ее поломки до определенного срока. Пусть срок службы коробки передач подчиняется нормальному закону. На сколь­ко месяцев в таком случае производитель должен дать гарантию для этой детали, чтобы число бес­платных ремонтов не превышало 2,275% продан­ных автомобилей?
 9. При производстве безалкогольных напитков специальный аппарат разливает определенное чис­ло унций (1 унция == 28,3 г) напитка в стандартную емкость. Число разлитых унций подчиняется нормальному закону с математическим ожиданием, зависящим от настройки аппарата. Количество унций напитка, разлитых отдельным аппаратом, имеет стандартное отклонение s = 0,4 унции. Пусть емкости объемом в 8 унций наполняются кока-колой. Сколько унций напитка должен в среднем разливать аппарат, чтобы не более 5% емкостей оказа­лось переполненными?
 10. Фирма, занимающаяся продажей товаров по каталогу, ежемесячно получает по почте заказы. Число этих заказов есть нормально распределен­ная случайная величина со средним квадратическим отклонением s = 560 и неизвестным математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12 439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц.
 11. Еженедельный выпуск продукции на заводе приблизительно распределен по нормальному закону со средним значением, равным 134 786 ед. продук­ции в неделю, и стандартным отклонением — 13000 ед. Найдите вероятность того, что еженедель­ный выпуск продукции: а) превысит 150000 ед.; б) окажется ниже 100 000 ед. в данную неделю; в) предположим, что возникли трудовые споры, и недельный выпуск продукции стал ниже 80 000 ед. Менеджеры обвиняют профсоюз в беспрецедентном падении выпуска продукции, а профсоюз утверждает, что выпуск продукции находится в пределах принятого уровня (±3s). Можно ли доверять проф­союзу?
 12. Почтовое отделение быстро оценивает объем переводов в рублях, взвешивая почту, полученную утром каждого текущего рабочего дня. Установле­но, что если вес почтовых отправлений составляет N кг, то объем переводов в рублях есть случайная величина, распределенная по нормальному закону со средним значением 160N и стандартным откло­нением 20N кг. Найдите вероятность того, что в день, когда вес почтовых отправлений составит 150 кг, объем переводов в рублях будет находиться в пределах: а) от 21 000 до 27 000 руб.; б) более 28 500 руб.; в) менее 22 000 руб.
 
 13. Менеджер ресторана по опыту знает, что 70% людей, сделавших заказ на вечер, придут в ресторан поужинать. В один из вечеров менеджер ре­шил принять 20 заказов, хотя в ресторане было лишь 15 свободных столиков. Чему равна вероят­ность того, что более 15 посетителей придут на заказанные места?
 14. Процент протеина в пакете с сухим кормом для собак — нормально распределенная случайная величина с математическим ожиданием 11,2% и стандартным отклонением 0,6%. Производителям корма необходимо, чтобы в 99% продаваемого кор­ма доля протеина составляла не меньше х1 %, но не более х2%. Найдите х1 и х2.
 15. Вес товаров, помещаемых в контейнер опре­деленного размера, — нормально распределенная случайная величина. Известно, что 65% контейне­ров имеют чистый вес больше чем 4,9 т и 25% — имеют вес меньше чем 4,2 т. Найдите ожидаемый средний вес и среднее квадратическое отклонение чистого веса контейнера.
 16. Отклонение стрелки компаса из-за влияния магнитного поля в определенной области Заполя­рья есть случайная величина Х ~ (0; 12). Чему рав­на вероятность того, что абсолютная величина от­клонения в определенный момент времени будет больше чем 2,4?
 17. Компания А покупает у компании В детали к контрольным приборам. Каждая деталь имеет точ­но установленное значение размера. Деталь, размер которой отличается от установленного размера бо­лее чем на ±0,25 мм, считается дефектной. Компа­ния А требует от компании В, чтобы доля брака не превышала 1% деталей. Если компания В выпол­няет требование компании А, то каким должно быть допустимое максимальное стандартное отклонение размеров деталей? Учесть, что размер деталей есть случайная величина, распределенная по нормаль­ному закону.
 18. Компьютерная система содержит 45 одина­ковых микроэлементов. Вероятность того, что лю­бой микроэлемент будет работать в заданное время, равна 0,80. Для выполнения некоторой опера­ции требуется, чтобы по крайней мере 30 микро­элементов было в рабочем состоянии. Чему равна вероятность того, что операция будет выполнена успешно?
 19. Технический отдел компании, производящей автопокрышки, планирует выпустить несколько экспериментальных партий покрышек и проверить степень их износа на тестирующем оборудовании. С этой целью предполагается увеличивать количе­ство каучука в покрышках каждой последующей партии до тех пор, пока срок службы покрышек окажется приемлемым. Эксперимент показал, что стандартное отклонение срока службы покрышек фактически остается постоянным от партии к партии и составляет 2 500 миль ( s = 2 500). Если компания хочет, чтобы 80% выпускаемых автопок­рышек имели срок службы не менее 25 000 миль, то какой наименьший средний срок службы авто­покрышек должен быть заложен в расчетах технического отдела? Считать срок службы автопокрышек нормально распределенным.
 20. Менеджер торгово-посреднической фирмы получает жалобы от некоторых клиентов на то, что служащие фирмы затрачивают слишком много вре­мени на выполнение их заказов. Собрав и проанализировав соответствующую информацию, он вы­яснил, что среднее время выполнения заказа состав­ляет 6,6 дн., однако для выполнения 20% заказов потребовалось 15 дн. и более. Учитывая, что время выполнения заказа есть случайная величина, рас­пределенная по нормальному закону, определите фактическое стандартное отклонение времени об­служивания клиентов.
 
 6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
 
 6.1. Понятие вариационного ряда. Виды вариационных рядов
 
 Прежде чем приступить к рассмотрению вариационных рядов дадим определение другим поняти­ям, используемым в статистике. Так, совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объек­том наблюдения.
 Всякий объект статистического наблюдения состо­ит из отдельных элементов — единиц наблюдения.
 Результаты статистического наблюдения пред­ставляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения принял интересующий исследова­теля признак в статистической совокупности. При­знаки бывают количественными и качественными.
 Количественным называется признак, значения которого выражаются числами.
 Качественным называется признак, характери­зующийся некоторым свойством или состоянием элементов совокупности.
 Статистическая совокупность называется гене­ральной, если исследованию подлежат все элемен­ты совокупности (сплошное наблюдение).
 Часть элементов генеральной совокупности, под­лежащая исследованию, называется выборочной совокупностью (выборкой). Она извлекается из ге­неральной совокупности случайно, так чтобы каж­дый из п элементов выборки имел равные шансы быть отобранным.
 Значения признака, которые при переходе от од­ного элемента совокупности к другому изменяют­ся (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у,z.
 Порядковый номер варианта (значения призна­ка) называется рангом: х1 — 1-й вариант (1-е значе­ние признака), х2 — 2-й вариант (2-е значение при­знака), хi— i-й вариант (i-e значение признака).
 Ряд значений признака (вариантов), располо­женных в порядке возрастания или убывания с соответствующими им весами, называется вариа­ционным рядом (рядом распределения).
 В качестве весов выступают частоты или частости.
 Частота (т) показывает, сколько раз встреча­ется тот или иной вариант (значение признака) в статистической совокупности.
 Частость или относительная частота (?i) по­казывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда
 Сумма всех частостей равна 1
 Вариационные ряды бывают дискретными и ин­тервальными.
 Дискретные вариационные ряды строят обычно в том случае, .если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 6.1, где i = 1, 2, ..., k.
 Таблица 6.1
 Значения признака (xi)x1x2 xk
 Частоты (тi)т1m2 mk
 
 
 Интервальные вариационные ряды строят обыч­но в том случае, если значения изучаемого при­знака могут отличаться друг от друга на сколь угод­но малую величину. Значения признака в них за­даются в виде интервалов. Общий вид интерваль­ного вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l.
 Таблица 6.2
 Значения признака (xi)а1-а2a2-a3...ai-1-ai
 Частоты (тi)m1т2...ml
 
 
 В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной (величиной) интервала.
 Величина 1-го интервала k1 определяется по фор­муле k1 = a2 - а1; 2-го — k2= а3- a2 последнего:
 k1=ai-ai-1
 В общем виде интервальную разность ki пред­ставим как
 
 ki=xi(max)-xi(min) (6.3)
 Если интервал имеет обе границы, то его назы­вают закрытым.
 Первый и последний интервалы могут быть от­крытыми, т. е. иметь только одну границу. Напри­мер, 1-й интервал может быть задан как «до 100», 2-й — «100-110», .... предпоследний — «190-200», последний — «200 и более». Очевидно, что 1-й ин­тервал не имеет нижней границы, а последний — верхней, оба они — открытые.
 Часто открытые интервалы приходится условно закрывать. Обычно для этого величину 1-го интервала принимают равной величине 2-го, а величину последнего — величине предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10, следовательно, нижняя граница 1-го условно соста­вит 100 - 10 = 90; величина предпоследнего равна 200 - 190 = 10, значит, верхняя граница последне­го условно составит 200 + 10 = 210.
 Кроме этого в интервальном вариационном ряде могут встречаться интервалы разной длины. Если ин­тервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равно­великими, в противном случае — неравновеликими.
 При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности). Для определения оптимальной величины интервалов (в том случае,если строится ряд с равными интервалами) приме­няют формулу Стэрджесса
 где п — число единиц совокупности; хmax и xmin наибольшее и наименьшее значения вариантов ряда.
 Для характеристики вариационного ряда наря­ду с частотами и частостями используются накопленные частоты и частости. Накопленные частоты (частости) показывают, сколько единиц совокупно­сти (какая их часть) не превышают заданного зна­чения (варианта) х.
 Их можно рассчитать по данным дискретного ряда, пользуясь формулой
 vi = тi + тi-1 +...+ т1. (6.5)
 Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.
 Дискретный вариационный ряд графически мож­но представить с помощью полигона распределения частот или частостей (рис.6.1).
 Интервальные вариационные ряды графически можно представить с помощью гистограммы, т. е, столбчатой диаграммы (рис. 6.2).
 При ее построении по оси абсцисс откладыва­ются значения изучаемого признака (границы интервалов). В том случае, если интервалы одинако­вой величины, по оси ординат можно откладывать частоты или частости. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относитель­ной плотности распределения. Абсолютная плотность — отношение частости интервала к его ве­личине:
 где f(a)i — абсолютная плотность i-го интервала;
 mi — его частота;
 ki— величина (интервальная разность).
 Абсолютная плотность показывает, сколько еди­ниц совокупности приходится на единицу интервала.
 Относительная плотность — отношение частости интервала к его величине:
 где f(0). — относительная плотность i-го интервала;
 wi — его частость.
 Относительная плотность показывает, какая часть единиц совокупности приходится на единицу ин­тервала.
 И дискретные, и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы. При построении первой по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересече­нии значений признака (вариантов) и соответству­ющих им накопленных частот (частостей) строят­ся точки, которые в свою очередь соединяются от­резками или кривой. Получающаяся таким обра­зом ломаная (кривая) называется кумулятой (ку­мулятивной кривой). Абсциссами ее точек явля­ются верхние границы интервалов. Ординаты об­разуют накопленные частоты (частости) соответ­ствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя гра­ница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту.
 Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).
 
 6.2. Числовые характеристики вариационного ряда
 Одной из основных числовых характеристик ряда распределения (вариационного ряда) является сред­няя арифметическая.
 Существует две формулы расчета средней ариф­метической: простая и взвешенная. Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы
 где хi — i-e значение признака; п — объем ряда (чис­ло наблюдений; число значений признака).
 Если частоты отличны друг от друга, расчет про­изводится по формуле средней арифметической взве­шенной
 где хi — i-e значение признака; тi — частота i-го значе­ния признака; k — число его значений (вариантов).
 При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной при­мет следующий вид:
 где хi — i-e значение признака; ?i — частость i-го значения признака; k — число его значений (вари­антов).
 Колеблемость изучаемого признака можно оха­рактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.
 Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид
 Среднее квадратическое отклонение рассчитыва­ется по формуле
 Коэффициент вариации определяется формулой
 Пример 1. При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7;
 4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.
 1) Составьте вариационный ряд распределения частот.
 2) Постройте полигон распределения частот, кумуляту.
 3) Определите средний размер (среднее число членов) семьи.
 4) Охарактеризуйте колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего квадратического отклонения, коэффициента вариации).
 Объясните полученные результаты, сделайте вы­воды.
 Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим, так как размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо по­строить дискретный вариационный ряд. Чтобы сде­лать это, необходимо подсчитать, сколько раз встре­чаются те или иные значения признака, и располо­жить их в порядке возрастания или убывания. Зна­чения изучаемого признака — размер семьи — обо­значим xi, частоты — тi.
 Произведем упомянутые расчеты и запишем их результаты в табл. 6.3.
 Таблица 6.3
 хi
  1
  2
  3
  4
  5
  6
  7
  8
  9
 
 mi
  2
  4
  6
  8
  10
  9
  6
  4
  1
 
 
 
 2) Дискретный вариационный ряд можно пред­ставить графически, построив полигон распределе­ния частот или частостей (рис. 6.3).
 Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная частота 1-го варианта (х1 = 1) равна самой частоте этого варианта, т. е. v1 = 2. Накопленная частота 2-го варианта (х2 = 2) равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6. Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49; v9 =50.
 Построим кумуляту (рис. 6.4).
 3) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга, расчет средней арифметической произведем по формуле (6.9)
 Средний размер семьи — 5,06 чел.
 4) Так как частоты неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12)
 Дисперсия размера семьи — 3,6964 чел2. Найдем среднее квадратическое отклонение раз­мера семьи по формуле (6.13)
 Среднее квадратическое отклонение размера се­мьи — 1,9226 чел.
 Найдем коэффициент вариации размера семьи по формуле (6.14)
 Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей яв­ляется неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.
 Ввиду неоднородности семей, попавших в выбор­ку, использование средней арифметической для характеристики наиболее типичного уровня разме­ра семьи не вполне оправданно — средняя арифметическая нетипична для изучаемой совокупности, в качестве характеристики наиболее типичного уров­ня размера семьи в данной совокупности лучше использовать моду или медиану.
 Пример 2. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.
 Предприятия с годовой мощностью, тыс. т
  Количество предприятий
 
 До 500
  27
 
 500 - 1 000
  11
 
 1 000 - 2 000
  8
 
 2 000 - 3 000
  8
 
 Свыше 3 000
  2
 
 
 
 1) Постройте гистограмму, кумуляту.
 2) Рассчитайте среднюю мощность предприятий.
 3) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.
 Объясните полученные результаты, сделайте вы­воды.
 Решение. 1) Данные о годовой мощности пред­приятий цементной промышленности представле­ны в виде интервального вариационного ряда — значения признака заданы в виде интервалов. При этом первый и последний интервалы — открытые: оба интервала не имеют одной из границ. Наконец, данный интервальный вариационный ряд — с нерав­ными интервалами: интервальные разности (раз­ность между верхней и нижней границами) интер­валов неодинаковы. Условно закроем границы от­крытых интервалов.
 Интервальная разность 2-го интервала
 1 000 - 500 = 500.
 Следовательно, нижняя граница 1-го интервала
 500 - 500 = 0.
 Интервальная разность предпоследнего интервала
 3 000 - 2 000 = 1 000.
 Следовательно, верхняя граница последнего ин­тервала
 3 000 + 1 000 = 4 000.
 В результате, получим следующий вариационный ряд (табл. 6.4):
 Таблица 6.4
 xi
  mi
 
 0-500
  27
 
 500 - 1 000
  11
 
 1 000 - 2 000
  8
 
 2 000 - 3 000
  8
 
 3 000 - 4 000
  2
 
 
 
 Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолют­ные плотности распределения по формуле (6.6)
 Построим гистограмму (рис. 6.5).
 Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.
 Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.
 Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 = 38.
 Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.
 Построим кумуляту (рис. 6.6).
 2) Рассчитаем среднюю мощность предприятий цементной промышленности в 1996 г. Так как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариа­ционного ряда в качестве значений признака принимаются середины интервалов, найдем их.
 Теперь расчет средней арифметической примет вид
 Средняя мощность предприятий цементной про­мышленности в 1996 г. составляла 964,29 тыс. т.
 Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми ин­тервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закры­ваются условно, в действительности значения при­знака у объектов, попадающих в открытые интер­валы, могут выходить далеко за их условные гра­ницы.
 В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интерваль­ного ряда с открытыми интервалами лучше исполь­зовать моду или медиану.
 3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.
 Так как частоты неодинаковы, для расчета дис­персии используем формулу (6.12)
 Дисперсия мощности предприятий — 862 563,78 (тыс. т)2.
 Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)
 Среднее квадратическое отклонение мощности предприятий — 928,74 тыс. т.
 
 
 Найдем коэффициент вариации по формуле (6.14)
 Коэффициент вариации годовой мощности пред­приятий цементной промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.
 Следовательно, использование средней арифме­тической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно — средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной сово­купности предприятий цементной промышленности.
 
 Задачи к теме 6
 1. По данным выборочного обследования получе­но следующее распределение семей по среднедушевому доходу
 Среднедушевой доход семьи в месяц, у. е.до 2525-5050-7575-100100-125125-150150 и
 выше
 Количество обследованных семей462362501761027812
 
 
 Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффи­циент вариации. Объясните полученные результаты.
 2. Постройте гистограмму частот, найдите сред­нюю заработную работников одного из цехов промышленного предприятия.
 Заработная плата, у. е.50-7575-100125-150150-175175-200200-225
 Число работников12233719159
 
 
 Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.
 3. Ниже представлена группировка отраслей и под­отраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.
 Сентябрь 1996 г., % к декабрю 1995 г.

<< Пред.           стр. 5 (из 19)           След. >>

Список литературы по разделу