<< Пред. стр. 13 (из 17) След. >>
Следовательно, вероятность того, что партия будет принята со второй попытки, т.е. что при контроле первой выборки обнаружится ровно одна дефектная единица, а затем при контроле второй-ни одной, равнаf3(p) = Р(Х=1) f2(p) = 20(1-р)19(1-р)40= 20(1-р)59.
Следовательно, вероятность принятия партии с первой или со второй попытки равна
f(p) = f1(p) + f3(p) = (1-р)20+ 20(1-р)59.
При практическом применении методов статистического приемочного контроля для нахождения оперативных характеристик планов контроля вместо формул, имеющих обозримый вид лишь для отдельных видов планов, применяют численные компьютерные алгоритмы или заранее составленные таблицы.
Риск поставщика и риск потребителя, приемочный и браковочный уровни дефектности. С оперативной характеристикой связаны важные понятия приемочного и браковочного уровней дефектности, а также понятия "риск поставщика" и "риск потребителя". Чтобы ввести эти понятия, на оперативной характеристике выделяют две характерные точки, делящие входные уровни дефектности на три зоны-А, Б и В. В зоне А все почти всегда хорошо, а именно - почти всегда экологическая обстановка признается благополучной, почти все партии принимаются. В зоне В, наоборот, почти всегда все плохо, а именно - почти всегда экологический контроль констатирует экологические нарушения, почти все партии бракуются. Зона. Б - буферная, переходная, промежуточная, в ней как вероятность приемки, так и вероятность браковки заметно отличаются от 0 и 1. Для задания границ между зонами выбирают два малых числа-риск поставщика (производителя, предприятия) и риск потребителя (заказчика, системы экологического контроля) , при этом границы между зонами задают два уровня дефектности - приемочный pпp и браковочный pбр, определяемые из уравнений
f(pпp) = 1-, f(pбр) = . (7)
Таким образом, если входной уровень дефектности не превосходит pпp, то вероятность забракования партии мала, т.е. не превосходит . Приемочный уровень дефектности выделяет зону А значений входного уровня дефектности, в которой нарушения экологической безопасности почти всегда не отмечаются, партии почти всегда принимаются, т.е. соблюдаются интересы проверяемого предприятия (в экологии), поставщика (при контроле качества). Это - зона комфортности для поставщика. Если он обеспечивает работу (уровень дефектности) в этой зоне, то его никто не потревожит.
Если же входной уровень дефектности больше браковочного уровня дефектности pбр, то нарушения почти наверняка фиксируются, партия почти всегда бракуется, т.е. экологи узнают о нарушениях, потребитель оказывается защищен от попадания к нему партий со столь высоким уровнем брака. Поэтому можно сказать, что в зоне В соблюдаются интересы потребителей - брак к ним не попадает.
При выборе плана контроля часто начинают с выбора приемочного и браковочного уровней дефектности. При этом выбор конкретного значения приемочного уровня дефектности отражает интересы поставщика, а выбор конкретного значения браковочного уровня дефектности - интересы потребителя. Можно доказать, что для любых положительных чисел и , и любых входных уровней дефектности pпp и pбр, причем pпp меньше pбр, найдется план контроля (n,c) такой, что его оперативная характеристика f(p) удовлетворяет неравенствам
f(pпp) > 1 - , f(pбр) < .
При практических расчетах обычно принимают = 0,05 (т.е. 5%) и = 0,1 (т.е. 10%).
Вычислим приемочный и браковочный уровни дефектности для плана (n,0). Из формул (5) и (7) вытекает, что
(1 - pпp)n = 1 - , pпp = 1 - (1 - )1/n.
Поскольку риск поставщика мал, то из известного соотношения математического анализа
вытекает приближенная формула
pпp
Для браковочного уровня дефектности имеем
pбр = 1 - 1/n.
При практическом применении методов статистического приемочного контроля для нахождения приемочных и браковочных уровней дефектности планов контроля вместо формул, имеющих обозримый вид лишь для отдельных видов планов, применяют численные компьютерные алгоритмы или заранее составленные таблицы, имеющиеся в нормативно-технической документации или научно-технических публикациях.
Предел среднего выходного уровня дефектности. Обсудим судьбу забракованной партии продукции. В зависимости от ситуации эта судьба может быть разной. Партия может быть утилизирована. Например, забракованная партия гвоздей может быть направлена на переплавку. У партии может быть понижена сортность, и она может быть продана по более низкой цене (при этом результаты выборочного контроля будут использованы не для проверки того, что выдержан заданный уровень качества, а для оценки реального уровня качества). Наконец, партия продукции может быть подвергнута сплошному контролю (для этого обычно привлекают инженеров из всех заводских служб). При сплошном контроле все дефектные изделия обнаруживаются и либо исправляются на месте, либо извлекаются из партии. В результате в партии остаются только годные изделия. Такая процедура называется "контроль с разбраковкой".
При среднем входном уровне дефектности р и применении контроля с разбраковкой с вероятностью f(p) партия принимается (и уровень дефектности в ней по-прежнему равен р) и с вероятностью (1- f(p)) бракуется и подвергается сплошному контролю, в результате чего к потребителю поступают только годные изделия. Следовательно, по формуле полной вероятности средний выходной уровень дефектности равен
f1(p)= pf(p) +0(1 - f(p)) = pf(p).
Средний выходной уровень дефектности f1(p) равен 0 при р=0 и р=1, положителен на интервале (0;1), а потому достигает на нем максимума, который в теории статистического контроля называется пределом среднего выходного уровня дефектности (сокращенно ПСВУД):
ПСВУД =
Пример. Рассмотрим план (n,0). Для него f(p) = (1 - p)n и f1(p) = p(1-p)n. Чтобы найти ПСВУД, надо приравнять 0 производную среднего выходного уровня дефектности по среднему входному уровню дефектности:
В полученном уравнении корень р = 1 соответствует минимуму, а не максимуму. Поскольку непрерывная функция на замкнутом отрезке достигает максимума, то максимум достигается при
Следовательно,
ПСВУД = (8)
По выражению (8) могут быть проведены конкретные расчеты. Однако оно довольно громоздко. Его можно упростить, используя один замечательный предел из курса математического анализа, а именно:
(9)
Сравнивая соотношения (8) и (9), видим, что
ПСВУД =
Первая скобка равна 1/n, а вторая согласно соотношению (9) приближается к 0,368 при росте объема выборки. Поэтому получаем простую асимптотическую формулу
ПСВУД
Для более сложных планов ПСВУД рассчитывают с помощью более или менее сложных компьютерных программ.
При рассмотрении основ статистического контроля в настоящем пункте расчетные формулы удалось получить лишь для простейших планов, в основном для планов вида (n,0). Если ослабить требования и рассчитывать не на точные формулы, а на асимптотические, при , то можно справиться и с одноступенчатыми планами вида (n, c).
13.2. Асимптотическая теория одноступенчатых планов
статистического контроля
Пусть Х - число дефектных единиц продукции в выборке объема n. Как уже отмечалось, распределение Х является биномиальным и имеет вид
Р (Х= k) = Cnk pk (1-p)n - k ,
где Cnk - число сочетаний из n элементов по k, а p - входной уровень дефектности.
Пусть используется одноступенчатый план контроля (n, c). Тогда оперативная характеристика этого плана имеет вид
Пусть Тогда по Закону Больших Чисел теории вероятностей (по теореме Бернулли)
(сходимость по вероятности). Значит, если с/n окажется заметно меньше входного уровня дефектности р, то партии будут почти всегда приниматься, а если с/n окажется заметно больше входного уровня дефектности р, то партии будут почти всегда отклоняться. Ситуация будет нетривиальной только там, где величины с/n и р близки друг к другу.
Хотя оперативная характеристика приближается с помощью сумм биномиальных вероятностей, целесообразно найти для нее приближение с помощью теоремы Муавра-Лапласа. Имеем цепочку тождественных преобразований:
Однако справа строит именно то выражение, которое участвует в теореме Муавра-Лапласа. Воспользовавшись равномерной сходимостью в этой теореме, можно записать, что
где (х) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Поскольку параметры в этой формуле связаны соотношением
то можно указать альтернативный вариант асимптотического выражения для оперативной характеристики:
Последняя формула позволяет без труда написать асимптотические выражения для приемочного и браковочного уровней дефектности. Действительно, согласно определениям этих понятий
откуда с помощью элементарных преобразований получаем, что
Поскольку при практическом применении статистического приемочного контроля, как уже отмечалось, принимают = 0,05, =0,10, то в предыдущие формулы следует подставить =1,64 и Итак, итоговые формулы для приемочного и браковочного уровней дефектности имеют вид
(10)
Из формул (10) следует, в частности, что
(11)
Следовательно, оценкой приемочной доли (отношения приемочного числа к объему выборки) является
. (12)
Из формулы (10) следует, что
(13)
Следовательно, из формул (12) и (13) вытекает способ оценивания необходимого объема выборки:
(14)
Итак, по формуле (12) можно рассчитать оценку выборочной доли, затем по формуле (14) - объем выборки, после чего, вернувшись к выборочной доле, найти приемочное число. Необходимо отметить, что результаты расчетов по рассматриваемым асимптотическим формулам отнюдь не всегда дают натуральные числа, поэтому необходима корректировка полученных результатов.
Рассматриваемые формулы позволяют решить сформулированную выше задачу - по заданным приемочному и браковочному уровням дефектности подобрать такой одноступенчатый план контроля, что его оперативная характеристика f(p) удовлетворяет неравенствам
f(pпp) > 1 - , f(pбр) < .
Поэтому при практической работе корректировка асимптотических результатов должна быть направлена на выполнение указанных неравенств.
Пример. Пусть pпp = 0,02, pбр = 0,09. Тогда по формуле (12) приемочная доля равна
Необходимый объем выборки рассчитывается по формуле (14):
Полученное число не является натуральным, поэтому вполне естественно откорректировать объем выборки до ближайшего целого, т.е. до 97. Тогда
Заменив с на ближайшее натуральное число, получаем в результате асимптотических расчетов одноступенчатый план (97, 6).
13.3. Некоторые практические вопросы статистического контроля
качества продукции и услуг
Познакомившись с некоторыми основными понятиями, подходами, и идеями теории статистического контроля качества, обсудим более практические стороны этой технико-экономической области.
Анализ и синтез планов контроля. На основе теории статистического контроля можно проанализировать планы контроля качества, имеющиеся в нормативно-технической документации (стандартах, технических условиях) и в договорах на поставку продукции и оказание услуг. Достаточно часто оказывается, что формулировки соответствующих разделов (разделов "Правила приемки", "Методы контроля" и др.) имеют различные недостатки и неточности, что может послужить в дальнейшем причиной к возникновению арбитражных ситуаций (т.е. решаемых через арбитражные или иные суды).
Если обсуждаемая система контроля качества выдерживает чисто логическую проверку, то наступает вторая стадия - анализ с точки зрения теории статистического контроля. На этой стадии рассчитывают характеристики применяемых планов контроля. О некоторых из них уже шла речь - приемочный и браковочный уровни дефектности, предел среднего выходного уровня дефектности. Есть и иные показатели, например, средний используемый объем выборки, средняя стоимость контроля, и т.п. Особенно важна прогнозируемая доля арбитражных ситуаций (споров между предприятиями) при используемой системе контроля.
На стадии анализа возможны неожиданные "открытия". Например, может оказаться, что существующая система контроля качества, хотя и является формально безупречной, но защищает лишь от партий продукции, в которой более половины единиц продукции дефектно (т.е. для применяемых планов контроля браковочный уровень дефектности больше 0,5). Или что система контроля защищает интересы поставщиков, у которых каждое пятое изделие является бракованным (приемочный уровень дефектности равен 0,2).
Замечание. До сих пор постоянно говорилось о контроле единиц и партий продукции. Однако нет никакого принципиального отличия с контролем услуг (медицинских, туристических, транспортных, образовательных, банковских и иных) или документации. Поэтому теория и практика статистического контроля качества продукции дает полезные рекомендации для банковского дела и бухгалтерского аудита. Надо только аккуратно заменить слова, описывающие предметную область применения теории статистического контроля.
После анализа ситуации с системой контроля естественно перейти к улучшению этой системы, к обоснованному выбору планов, к этапу синтеза. В зависимости от конкретных условий используются разнообразные подходы к выбору планов. Например, задают приемочный и браковочный уровни дефектности. В случае контроля с разбраковкой естественно использовать ограничения на предел среднего выходного уровня дефектности.
Обсудим подробнее оптимизационные постановки в статистическом приемочном контроле. Очевидно, имеется три вида затрат и потерь:
- затраты непосредственно на проведение контроля единиц продукции, включенных в выборку,
- потери в случае неверного решения о забраковании партии продукции (в которой на самом деле доля дефектной продукции соответствует требованиям нормативно-технической документации):
- потери в случае неверного решения о принятии партии продукции (в которой на самом деле доля дефектной продукции не соответствует требованиям нормативно-технической документации).
При этом первые два вида затрат непосредственно связаны с деятельностью предприятия, на котором производится продукция, третий вид затрат формируется там, где она потребляется. С этим связана принципиальная сложность подсчета затрат третьего вида. Особенно эта сложность проявляется тогда, когда попадание к потребителю дефектных изделий может привести к авариям с человеческими жертвами. Тогда в очередной раз возникает уже обсуждавшийся вопрос: сколько стоит человеческая жизнь? Только оценив потери здоровья и жизни в денежных единицах, можно сформировать функционал качества плана статистического контроля и затем оптимизировать его. К счастью, для большинства видов продукции вопрос о денежной оценке человеческой жизни не возникает. Проблема обычно "всего лишь" в том, что выпущенная продукция используется разнообразными конечными потребителями, а потому оценить эффект повышения доли ее дефектности затруднительно.
Поэтому наряду с функционалом качества, включающим все три вида затрат, рассматривают "условный" функционал на основе затрат первых двух типов, а на вероятность принятия партии продукции, в которой доля дефектной продукции не соответствует требованиям нормативно-технической документации, накладывают ограничение, т.е., грубо говоря, третий вид затрат учитывают в качестве ограничения.
Естественно также по-разному проводить контроль у поставщика (производителя) и потребителя (заказчика). Пусть для определенности поставщик используют план а потребитель - Тогда естественно зафиксировать в договоре о поставке, что Такая договоренность обеспечит тщательный контроль со стороны изготовителя и почти автоматическое подтверждение приемки со стороны потребителя (т.е. отсутствие спора).
Одна из распространенных догм состоит в том, что изготовитель и потребитель должны проводить контроль по одним и тем же планам контроля. Если план контроля и входной уровень контроля таков, что ситуация контроля относится к буферной зоне Б, т.е. вероятность приемки партии заметно отличается от 0 и 1, то указанная догма приводит к высокой вероятности спорных ситуаций. Пусть, например, оперативная характеристика равна 0,5. Пусть изготовитель принял партию (с вероятностью 0,5). После этого при независимом контроле у потребителя с той же вероятностью 0,5 она может быть отклонена и с вероятностью 0,5 принята. Значит, общий итог таков: 59% за то, что партия будет забракована у поставщика, 25% - за спорную ситуацию (поставщик принял, потребитель забраковал), 25% - за принятие и поставщиком и потребителем. Конечно, рассмотрен крайний случай - наиболее частое появление спорных ситуаций. Но реальное появление 10-15% арбитражных споров - это типовая ситуация в 1980-е годы.
Один из вариантов выбора планов контроля поставщиком и потребителем выглядит так. Стороны договариваются о некотором "приемлемом" входном уровне дефектности р*. Затем поставщик выбирает план контроля, используя р* как браковочный уровень дефектности, а потребитель - рассматривая р* как приемочный уровень дефектности. Подробнее об анализе, синтезе и оптимизации планов статистического контроля рассказано в специальной литературе, в частности, в работах [6,8].
Усеченные планы. Рассмотрим план статистического контроля (60, 3). Пусть при проверке единицы продукции появляются в таком порядке: дефектная, дефектная, дефектная, дефектная,... Четыре дефектные единицы подряд! Надо ли дальше проверять выборку? Исходя из здравого смысла - нет. Ведь совершенно неважно, каковы будут результаты по остальным 59-и единицам продукции, окажутся они годными или дефектными - 4 дефектные единицы уже есть, и партию следует забраковать. Контроль мог бы быть перекрашен и тогда, когда при проверке 60 единиц все 60 окажутся годными - независимо от качества остальных 3 партию надо принимать.
Усеченные планы - это планы статистического контроля, в которых контроль разрешается прекращать, если итог (принятие или забракование партии) становится ясен ранее, чем проведен контроль всех включенных в выборку единиц продукции. Усеченные планы применяются, когда единицы продукции поступают на контроль последовательно, одна за другой (или группа за группой). Это не всегда так. Если, например, план (60, 3) применяется для контроля качества электролампочек, и все 63 лампочки ввернуты в гнезда на испытательном стенде и одновременно включены, то подход на основе усеченных планов применить нельзя.
Возможность применения усеченных планов должна быть явным образом указана в нормативно-технической документации и в договорах на поставку. Опишем юридический казус, связанный с усеченными планами. В ГОСТе на штангенциркули был предусмотрен план контроля (20,0). Органы Госстандарта проверяли завод "Точнометр" (название изменено). Проверили первый штангенциркуль - дефектен, второй - дефектен,..., десятый - дефектен. На этом комиссия остановилась, вполне резонно (с точки зрения здравого смысла) решив, что партия штангенциркулей должна быть забракована. Органы Госстандарта наложили на завод "Точнометр" штраф за выпуск некачественной продукции (в соответствии с действующим в то время правопорядком). Однако завод опротестовал это решение в суд. И суд удовлетворил протест, ссылаясь на то, что порядок проведения контроля качества штангенциркулей был нарушен! Бракоделы не смогли бы уйти от наказания, если бы в соответствующих документах была бы прописана возможность использования усеченных планов.
Выделение единиц бесформенной (жидкой, газообразной) продукции. Во всем предыдущем изложении постоянно встречается термин "единица продукции". Он вполне ясен, если речь идет об отдельных изделиях - дискетах, коробках спичек, патронах, бутылках минеральной воды, электробритвах, или отдельных деталях - болтах, гвоздях, пластмассовых дисках... Совершенно ясно, что многие виды продукции имеют иной вид - газообразный, жидкий или, как говорят, бесформенный (порошкообразный, желеобразный,...). Как быть с ним? В работе [9] предложен подход, позволяющий применить к бесформенной продукции методы статистического контроля качества.
Основное - это выделить единицу продукции. Она не должна быть очень малой, поскольку ясно, что в бесформенной продукции свойства вещества в близких точках близки. Основная идея состоит в том, чтобы взять некоторое количество пар точек, отстоящих друг от друга на определенное расстояние, и выяснить, есть связь (т.е. значим ли ранговый коэффициент корреляции Спирмена - см. главу 5) между значениями изучаемого свойства в этих парах точек или нет. Если связь есть, значит, точки разнесены на недостаточное расстояние, другими словами, точки относятся к одной и той же единице продукции. Поэтому расстояние между точками надо увеличить. Если связь уже не обнаруживается, то это значит, что они относятся к разным единицам продукции. В процессе увеличения расстояния тем самым была оценена величина ребра куба, в виде которого условно представляем себе единицу бесформенной продукции. Разбив бесформенную продукцию на единицы, можно применять описанные выше подходы для контроля ее качества (подробнее см. [9]).
Отбор случайной выборки при статистическом контроле качества продукции. Как и при любом выборочном обследовании, при статистическом контроле качества продукции остро строит проблема отбора репрезентативной (представительной) выборки (см. главу 2 выше). Эта проблема усугубляется экономической заинтересованностью участников процесса. В соответствии с обсуждениями главы 11 наиболее научно-обоснованным является использование датчиков псевдослучайных чисел. С другой стороны, исходя из экономической и технической целесообразности, популярна схема многоступенчатой выборки. Например, из 15 вагонов отобрать вагон № 5, из него - контейнер №3 около двери (из 12 контейнеров), из контейнера №3 - ящики №№ 7, 15 и 23, а из этих ящиков - каждое пятое изделие. При этом описании составления выборки совершенно ясно, что реально классическая случайная выборка организуется лишь при контроле контейнера №3, и остается только надеяться, что он является типичным для всей партии.
13.4. Всегда ли нужен контроль качества продукции?
Чем выше достигнутый уровень качества, тем больше необходимый объем контроля - таков парадокс классической теории статистического контроля. Возможный выход состоит в переходе к расширению возможностей менеджера при выборе технической политики на основе учета экономических рисков. Перекладывание контроля на потребителя может быть экономически выгодно, если производитель организовал защиту от риска методом пополнения партий или путем развития технического обслуживания.
В государственных стандартах, технических условиях, другой нормативно-технической документации, относящейся к потребительским товарам и услугам, различным изделиям, веществам, материалам, иным видам продукции, а также в договорах между поставщиками и потребителями обычно присутствуют разделы "Правила приемки и методы контроля". Поэтому, в частности, методы статистического контроля качества продукции являются важной составной частью статистических методов сертификации, которым посвящена работа [4]. Как уже говорилось, имеется соответствующая вероятностно-статистическая теория, посвященная анализу и синтезу (выбору) планов контроля. Однако эта теория вообще не предусматривает отказа от контроля, поскольку игнорирует возможность перехода на иную стратегию организации взаимоотношений поставщика и потребителя, например, на стратегию технического обслуживания, при которой выходной контроль не проводится, а обнаруженные потребителями дефектные изделия заменяются годными или ремонтируются. Основная обсуждаемая в настоящем пункте идея - обоснование необходимости включения теории статистического приемочного контроля в более широкую технико-экономическую теорию взаимоотношений поставщиков и потребителей и целесообразности перехода при повышении качества продукции от контроля качества к иным способам защиты потребителя, например, к развитому техническому обслуживанию или к поставке запасных единиц продукции.
Использование экономических показателей при выборе планов статистического (выборочного) контроля пропагандировалось давно, но делалось это в рамках парадигмы обязательности контроля. Здесь рассматривается более широкая система взглядов, согласно которой контроль качества продукции - лишь один из способов урегулирования взаимоотношений между поставщиками и потребителями.
В более широком плане речь идет об отказе от получения детальной информации, если она стоит слишком дорого, и переходе к использованию иных механизмов управления. Так, качественные методы химического анализа часто используют именно потому, что соответствующие количественные методы более трудоемки и дороги, но не намного полезнее с практической точки зрения. Пример из всем знакомой области: в средней школе знания учащихся контролируются еженедельно, в высшей же - один или несколько раз в семестр, однако разница с точки зрения эффективности управления процессом обучения невелика. Другой пример: как показано в статистике интервальных данных (см. главу 9), из-за погрешностей измерений нецелесообразно увеличивать их число сверх некоторого "рационального объема выборки", а для увеличения точности оценивания характеристик вероятностных распределений необходимо использовать более точные средства измерения. С учетом сказанного описываемый в настоящем пункте подход представляется менее необычным.
Оценка снизу необходимого объема выборки. Как известно, в теории статистического приемочного контроля качества продукции разработано много подходов к выбору планов контроля:
- на основе приемочного и браковочного уровней дефектности;
- исходя из предела среднего выходного уровня дефектности (при контроле с разбраковкой);
- с использованием экономических показателей, относящихся к предприятию (см., например, ГОСТ 24660-81);
- с использованием экономических показателей, относящихся к народному хозяйству в целом; и т.д. (см. предыдущий пункт).
Имеется обширная литература, посвященная обоснованию и сравнению этих подходов, разработке соответствующей математической теории и программного обеспечения. Не углубляясь в эти проблемы, сосредоточим внимание на одном парадоксальном явлении: при повышении качества выпускаемой продукции теория рекомендует увеличивать объем контроля!
Действительно, при повышении качества выпускаемой продукции требования потребителя, очевидно, обеспечиваются все лучше. Следовательно, должен уменьшаться браковочный уровень дефектности, т.е. то значение входного уровня дефектности, при котором вероятность приемки партии равна риску потребителя. Из всех планов с общим объемом контроля n минимум вероятности приемки партии (т.е. оперативной характеристики) достигается на одноступенчатом плане (n,0). (Напомним, что согласно этому плану партия принимается тогда и только тогда, когда из n проверенных единиц продукции все оказываются годными.) Другими словами, оперативная характеристика для плана (n,0) является огибающей (снизу) множества всех оперативных характеристик. Следовательно, из всех планов с общим объемом контроля n минимум браковочного уровня дефектности достигается также на плане (n,0).
В дальнейшем будем исходить из биномиальной модели выборки, согласно которой число дефектных единиц продукции в выборке объема n имеет биномиальное распределение с параметрами n и p, где p - входной уровень дефектности. Как хорошо известно, эта модель является приближением для модели простой случайной выборки из партии, согласно которой указанное число имеет гипергеометрическое распределение. Напомним, что гипергеометрическая модель переходит в биномиальную, если объем партии безгранично возрастает, а доля дефектных единиц продукции в партии приближается к p. Если объем выборки составляет не более 10% объема партии, то с достаточной для практики точностью принимают, что соответствующее биномиальное распределение хорошо приближает гипергеометрическое.
Примем обычное предположение о том, что риск потребителя равен 0,10. Как известно, браковочный уровень дефектности pбр для плана (n,0) определяется из условия
(1 - pбр )n = 0,10 .
Это соотношение дает возможность по заданному браковочному уровню дефектности pбр найти необходимый объем выборки:
n = ln 0,10 / ln (1 - pбр ) = - 2,30 / ln (1 - pбр ) .
Поскольку в силу сказанного ранее представляют интерес малые значения браковочного уровня дефектности, воспользуемся тем, что при малых x согласно правилам математического анализа
ln (1 + x) = x + O (x2) .
Вторым слагаемым в правой части последней формулы, как обычно в асимптотических рассуждениях, можно пренебречь. Следовательно, необходимый объем выборки с достаточной точностью может быть найден по формуле
n = 2,30 / pбр . (15)
(При конкретных расчетах надо, очевидно, правую часть округлить до ближайшего целого числа.) Например, при довольно низком (с точки зрения мирового рынка) качестве выпускаемой продукции можно задать pбр = 0,01, т.е. потребовать, чтобы почти все (точнее, не менее 90%) партии, в которых дефектных единиц больше, чем 1 из 100, были забракованы и не достигли потребителя. Тогда объем контроля должен составлять не менее n = 230.
Основной парадокс теории статистического приемочного контроля. Как следует из сказанного выше, необходимый объем выборки, определяемый для какого-либо плана контроля по заданному браковочному уровню дефектности pбр , будет не меньше, чем для плана (n,0), т.е. не меньше, чем 2,30 / pбр .Таким образом, если достигнут достаточно высокий уровень качества, такой, что потребителю может попасть не более 1 дефектной единицы продукции из 10000, т.е. pбр = 0,0001, то объем контроля должен быть не меньше n = 23000. Если же качество повысится в 100 раз, т.е. потребителю сможет попасть не более 1 дефектной единицы продукции из 1000000, то объем контроля и затраты на него возрастут также в 100 раз, и минимально необходимый объем контроля составит 2,3 миллиона единиц продукции. Поскольку объем партий большинства видов продукции существенно меньше этого числа, то проведенные выше расчеты говорят о необходимости перехода на сплошной контроль.
Итак, выводы парадоксальны: если качество выпускаемой продукции не очень хорошее, то целесообразно проводить статистический (выборочный) контроль, если же качество возрастает, то объем контроля и затраты на него увеличиваются, вплоть до перехода на сплошной контроль. Если это возможно, т.е. контроль не является разрушающим. А если невозможно, то попадаем в тупиковую ситуацию - высокое качество не может быть подтверждено.
В реальных ситуациях объемы контролируемых выборок - единицы или десятки, но обычно отнюдь не сотни и тысячи. Если контролируются 100 изделий, то согласно формуле (15) браковочный уровень дефектности равен 2,3 %. И это - предел для реально используемых объемов контроля. Следовательно, статистический приемочный контроль (в том числе выходной или входной) может быть применен для контроля лишь такой продукции, в которой из 50 изделий хотя бы одно дефектно. Другими словами, этот метод управления качеством предназначен лишь для продукции сравнительно низкого качества (входной уровень дефектности не менее 1-2%) или при обслуживании потребителя, согласного на довольно высокий браковочный уровень дефектности (не менее 2,3%).
Следовательно, для повышения качества необходимо использовать контрольные карты и другие методы статистического регулирования технологических процессов на предприятии (о них подробно рассказано, например, в монографиях [1,10]), методы "всеобщего (в другом переводе - тотального) контроля качества" и др. Недаром этим методам уделяется больше внимания в зарубежных методических изданиях, чем собственно статистическому приемочному контролю.
От контроля к пополнению партии. Рассмотрим простую идею: отказываемся от контроля качества вообще, но зато по первому требованию потребителя заменяем дефектную единицу продукции на новую. При этом экономим на контроле, но вместо этого тратим средства на замену продукции. Выгодно это или не выгодно?
Замена продукции может проводиться различными способами. Для многих видов товаров народного потребления это делается с помощью системы гарантийного обслуживания, гарантийных сроков и мастерских, через сеть розничной торговли и т.д.
Другой вариант - к партии поставляемой продукции добавляется некоторое количество единиц продукции для замены имеющихся, возможно, в ней дефектных единиц. Сначала обсудим подробнее именно этот вариант идеи замены продукции.
Пусть поставщик выпускает продукцию с известным ему уровнем дефектности p. Тогда число Х дефектных единиц в партии объема N имеет биномиальное распределение с параметрами N и p. По теореме Муавра-Лапласа Х не превосходит (при достаточно большом N) величины
D0(t) = Np + t (Np(1-p))1/2
с вероятностью Ф(t). где Ф(.) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Поскольку Ф(4) = 0,999968329, то для практических целей достаточно положить t = 4, при этом более чем D0(4) дефектных единиц продукции попадет в партию лишь в 3 случаях из 100000.
Пусть С0 - цена одной единицы продукции, С1 - стоимость неразрушающего контроля одной единицы продукции (с исправлением дефектов при их обнаружении). Сравним сначала две стратегии технико-экономических отношений поставщика с потребителями:
сплошной контроль (затраты С1N)
и пополнение партии дополнительными изделиями в числе D0(4) (затраты С0D0(4) ). Вторая стратегия лучше (экономически выгоднее), если
(16)
Поделим на получим равносильное неравенство
.
Поскольку p(1-p) не превосходит 1/4 при всех p, то из неравенства
С1/С0 > p + 2 / N1/ 2 (17)
вытекает неравенство (16). Ясно, что в случае, если
С1/С0 > p ,
неравенство (17) (а потому и неравенство (16)) выполняется при достаточно больших объемах партии, а именно, при
N > {2 С0 / (С1 - С0 p)} 2 .
Например, если стоимость контроля составляет 10% от стоимости продукции (типовая ситуация в машиностроении), т.е. С1/С0 = 0,1, а уровень дефектности p = 0,01, то последнее неравенство дает N>493. В то же время нетрудно проверить, что неравенство (16) выполняется при
0,1 > 0.01 + 4 (0.01*0,99)1/ 2 / N1/ 2 ,
т.е. при N > 19. Расхождение более чем на порядок (в 26 раз) объясняется заменой при переходе от формулы (16) к формуле (17) величины p(1-p) на 1/4, т.е. на гораздо большую величину - при малом входном уровне дефектности p.
Выгодно ли введение статистического контроля? Пусть рассматривается описанная выше стратегия пополнения партий. Мы сравнивали ее со стратегией сплошного контроля, которая во многих случаях оказалась хуже. Может быть, поставщику имеет смысл использовать статистический контроль? Понятно, что речь может идти лишь о (неразрушающем) контроле с разбраковкой, поскольку только в этом случае меняется доля дефектности в потоке партий, направляемых потребителям.
Пусть используется план (n,0) с приемочным уровнем дефектности, равным реально достигнутому предприятием уровню дефектности p. Как известно, тогда объем выборки определяется из условия
(1-p)n = 0,95,
т.е.
n = ln 0,95 / ln (1 - p ) = - 0,0513 / ln (1 - p ) .
При малом p уже не раз применявшееся соотношение из математического анализа дает с достаточной для практики точностью
n = 0,05 / p .
С вероятностью (1-p)n = 0,95 партия принимается, с вероятностью 0,05 подвергается разбраковке. В первом случае партия поступает к потребителю с тем же уровнем дефектности, что и до контроля, но при этом добавляются затраты на контроль, равные С1n. Партию необходимо пополнить D0(4) изделиями (затраты С0D0(4)), общие затраты (в среднем на одну выпущенную партию) равны
0,95 (С1n + С0 D0 (4)) .
Во втором случае фактически проводится сплошной контроль с исправлением дефектов и затратами С1N. Суммарные затраты при использовании выборочного контроля равны
0,95 (С1n + С0 D0 (4)) + 0,05 С1N .
Он более выгоден, чем отсутствие контроля (с добавлением "запасных" изделий), в случае справедливости неравенства
0,95 (С1n + С0 D0 (4)) + 0,05 С1N < С0 D0 (4),
что эквивалентно неравенству
19 С1n + С1N < С0 D0 (4).
Сравнение с формулой (16) показывает, что если контроль не является разрушающим, то выборочный контроль менее выгоден, чем сплошной (по сравнению с формулой (16) добавляется первое слагаемое в левой части последней формулы), и тем более весьма проигрывает в экономической эффективности по сравнению с отсутствием контроля в сочетании с пополнением партии.
Итак, введение статистического контроля в схеме пополнения партии не выгодно.
От системы контроля к системе технического обслуживания. Вернемся к первому из указанных ранее вариантов замены продукции. Что выгоднее - сплошной контроль на предприятии или замена дефектных изделий, обнаруженных потребителями? Реальное перекладывание контроля на потребителей влечет потери, связанные с удовлетворением их претензий, но при малой доле дефектных изделий эти потери малы по сравнению с затратами на контроль.
Действительно, пусть W - средние потери поставщика, связанные с пропуском потребителю дефектной единицы продукции. Сюда входят, в частности, такие виды потерь:
- стоимость новой единицы продукции (при замене изделия или возврате его стоимости);
- расходы системы распределения продукции и гарантийного ремонта, включая издержки на устранение дефектов;
- потери из-за нежелательного изменения предпочтений потребителя, из-за снижения имиджа фирмы;
- затраты на возмещение ущерба, понесенного потребителем, страховые сборы, судебные издержки, и т.д.
Потери W в несколько раз (по экспертной оценке - обычно в 5-10 раз) превышают расходы С0 на изготовление единицы продукции. Кроме того, для быстрого решения проблем потребителей, связанных с обнаружением дефектов, необходима развитая система технического обслуживания.
Пусть изготовлена партия продукции объема N. Тогда расходы на сплошной (неразрушающий) контроль составляют С1N (при этом дефектные единицы продукции извлекаются и утилизируются, расходами на утилизацию или доходами от нее в настоящем изложении пренебрегаем). Пусть p - доля дефектных единиц продукции в партии. Тогда Np - математическое ожидание числа дефектных единиц продукции в партии, а WNp - математическое ожидание потерь. Если
WNp < С1 N, p < С1 / W, (18)
то выгоднее отказаться от сплошного контроля. При повышении качества, т.е. снижении доли дефектности, целесообразно переходить к поиску и устранению дефектов не непосредственно на предприятии, а в пунктах системы технического обслуживания.
В формуле (18) участвует математическое ожидание WNp. Реальные потери могут быть больше, но не намного. Как и выше, с помощью теоремы Муавра-Лапласа можно утверждать, что практически наверняка они не превышают WD0(4), а потому преимущество решения об отказе от контроля неоспоримо при
WD0(4) < С1N, p + 4 (p(1-p))1/ 2 / N1/ 2 < С1 / W. (19)
Аналогично выводу неравенства (17) заключаем, что неравенство (19) наверняка будет выполнено, если
p + 2 / N1/ 2 < С1 / W. (20)
Пусть С1 / W = 0,1, выпускается партия объема N = 1600. Тогда согласно неравенству (20) отказ от контроля выгоден уже при p< 0,05, т.е. граничное значение соответствует довольно низкому уровню качества - 1 единица продукции из 20.
Выгодно ли в рассматриваемой ситуации вводить выборочный контроль? Пусть объем контроля равен n, приемочное число с = 0, с вероятностью y партия принимается, а с вероятностью 1 - y бракуется (и затем подвергается разбраковке). В первом случае расходы на контроль равны С1n, а остальная часть партии содержит в среднем (N - n) p дефектных единиц продукции, и средние издержки равны y{С1n + W(N - n)p}. Во втором случае суммарные затраты равны (1 - y)С1N . Следовательно, введение контроля выгодно, если
y{С1n + W(N - n)p} + (1 - y)С1 N < WNp .
Преобразуем это неравенство к виду
yn{С1 - Wp}(1 - y)-1 + С1N < WNp. (21)
Если выполнено неравенство p<С1/W, то второе слагаемое в левой части неравенства (21) больше правой части этого неравенства, в то время как первое слагаемое в левой части (21) положительно. Следовательно, неравенство (21) неверно, и введение выборочного контроля нецелесообразно - как и в разобранном ранее случае метода пополнения партий.
Выше приведен базовый (простейший, исходный) метод сравнения различных систем взаимоотношений поставщиков и потребителей. Целесообразно дальнейшее его развитие, которое предоставляем читателю.
Отметим в заключение, что реально статистический контроль качества продукции, осуществляемый поставщиком (выходной контроль), решает две основные задачи: обеспечение интересов потребителя и обнаружение разладок собственных технологических процессов (по результатам контроля последовательности партий). Как показано выше, для решения первой из этих задач он не всегда оптимален. Вторую из названных задач также часто эффективнее решать с помощью иных методов, например, обнаруживать разладку технологических процессов с помощью тех или иных контрольных карт. Таким образом, область применения методов статистического приемочного контроля является довольно ограниченной. Очевидно, однако, что нельзя исключать эти методы из арсенала менеджеров по качеству, в частности, при использовании концепции "всеобщего управления качеством (TQM - Total Quality Management)". Хотя бы потому, что они незаменимы при использовании разрушающих методов контроля.
Наиболее перспективным представляется использование результатов настоящего пункта в рамках концепции контроллинга - современной концепции системного управления организацией, в основе которой лежит стремление обеспечить ее долгосрочное эффективное существование (см., например, [11-13]).
Итак, в настоящем пункте сформулирован основной парадокс теории статистического приемочного контроля - повышение качества выпускаемой продукции приводит к увеличению объема контроля. Описан способ разрешения этого парадокса на основе перехода от чисто технической политики выбора плана контроля к технико-экономической, основанной на сравнении по экономическим показателям схем контроля и схем технического обслуживания и пополнения партий. Проанализирован базовый метод такого сравнения, позволяющий выделить область экономического преимущества схемы пополнения партий и схемы технического обслуживания по сравнению со схемой контроля.
13.5. Статистический контроль по двум альтернативным признакам
и метод проверки их независимости по совокупности малых выборок
В настоящем пункте рассмотрим статистический приемочный контроль по двум альтернативным признакам одновременно. Обсуждается соотношение входного уровня дефектности изделия в целом с входными уровнями дефектности отдельных контролируемых параметров. На основе результатов статистики объектов нечисловой природы (глава 8) рассмотрен метод проверки независимости двух альтернативных признаков. Метод нацелен на применение прежде всего в задачах статистического контроля качества продукции. При этом проверка независимости проводится по совокупности малых выборок, т.е. в так называемой асимптотике А.Н.Колмогорова, когда число неизвестных параметров распределения не является постоянным, а растет пропорционально объему данных.
При статистическом контроле качества продукции, в частности, при сертификации, чаще всего используют контроль по альтернативным признакам. При этом устанавливается, соответствует ли контролируемый параметр единицы продукции (изделия, детали) заданным в нормативно-технической документации требованиям или не соответствует. Если соответствует - единица продукции признается годной. Примем для определенности, что в этом случае результат контроля кодируется символом 0. Если же не соответствует - единица продукции признается дефектной, а результат контроля кодируется символом 1.
Таким образом, в рассматриваемой нами математической модели контроля альтернативный признак - это функция X = X(w), определенная на множестве единиц продукции W = {w} и принимающая два значения 0 и 1, причем X(w) = 0 означает, что единица продукции w является годной, а X(w) = 1 - что она является дефектной.
Методы статистического контроля, в частности, включенные в государственные стандарты и иную нормативно-техническую документацию (НТД), как правило, используют контроль по одному признаку. В НТД указывают правила выбора планов контроля и расчета различных их характеристик, приводят графики оперативных характеристик и т.п.
Однако на производстве контроль нередко проводится по нескольким альтернативным признакам. Возникает проблема выбора плана контроля и расчета его характеристик. В настоящее время для решения этой проблемы нет достаточно обоснованных и общепринятых рекомендаций.
Рассмотрим сначала контроль по двум альтернативным признакам X(w) и Y(w). В вероятностной модели X(w) и Y(w) - случайные величины, принимающие два значения - 0 и 1. Пусть, пользуясь стандартной терминологией,
p1 = P ( X(w) = 1)
- входной уровень дефектности для первого признака, а
p2 = P ( Y(w) = 1)
- для второго. Вероятности результатов контроля по двум признакам одновременно описываются четырьмя числами:
P ( X(w) = 0, Y(w) = 0) = p00 , P ( X(w) = 1, Y(w) = 0) = p10 ,
P ( X(w) = 0, Y(w) = 1) = p01 , P ( X(w) = 1, Y(w) = 1) = p11 ,
при этом справедливы соотношения:
p00 + p10 + p01 + p11 = 1, p10 + p11 = p1 , p01 + p11 = p2 .
С прикладной точки зрения наиболее интересна вероятность p00 того, что единица продукции является годной (по всем параметрам), и вероятность ее дефектности (1-p00 ), т.е. входной уровень дефектности для изделия в целом.
В табл.1 сведены вместе введенные выше вероятности.
Табл. 1. Вероятности результаты испытаний
при контроле по двум альтернативным признакам
X=0 X=1 Всего Y=0 Y=1 Всего 1
Есть три важных частных случая - поглощения, несовместности и независимости дефектов, другими словами, поглощения, несовместности и независимости событий {w: X(w) = 1} и {w: Y(w) = 1}. В случае поглощения одно из этих событий содержит другое, а потому
p00 = 1 - max ( p1 , p2 ) .
В случае несовместности
p00 = 1 - p1 - p2 .
В случае независимости
p00 = (1 - p1 )(1 - p2) = 1 - p1 - p2 + p1p2 .
Ояевидно, что вероятность годности изделия всегда заключена между значениями, соответствующими случаям поглощения и несовместности. Кроме того, известно, что при большом числе признаков и малой вероятности дефектности по каждому из них случаи поглощения и независимости дают (в асимптотике) крайние значения для вероятности годности изделия, т.е. формулы, соответствующие независимости и несовместности, асимптотически совпадают.
Рассмотрим несколько примеров. Пусть некоторая продукция, скажем, гвозди, контролируются по двум альтернативным признакам, для определенности, по весу и длине. Пусть результаты контроля 1000 единиц продукции представлены в табл.2
Табл. 2. Результаты 1000 испытаний
по двум альтернативным признакам (случай поглощения)
Х=0 Х=1 Всего У=0 952 0 952 У=1 0 48 48 Всего 952 48 1000
Судя по данным табл.2, дефекты всегда встречаются парами - если есть один, то есть и другой. Входной уровень дефектности как по каждому показателю, так и по обоим вместе - один и тот же, а именно, 0,048. Получив по результатам статистического наблюдения данные типа приведенных в табл.2, целесообразно перейти к контролю только одного показателя, а не двух. Каково именно? Видимо, того, контроль которого дешевле. Однако совсем иная ситуация в случае несовместности дефектов (табл.3).
Табл. 3. Результаты 1000 испытаний
по двум альтернативным признакам (случай несовместности )
Х=0 Х=1 Всего У=0 904 48 952 У=1 48 0 48 Всего 952 48 1000
Судя по данным табл.3, дефекты всегда встречаются поодиночке - если есть один, то другого нет. В результате входной уровень дефектности по каждому признаку по-прежнему равен 0,048, в то время как доля дефектных изделий (т.е. имеющих хотя бы один дефект) вдвое выше, т.е. входной уровень дефектности для изделия в целом равен 0,096.
Случай независимости результатов контроля по двум независимым признакам (табл.4) лежит между крайними случаями поглощения и несовместности. Независимость альтернативных признаков обосновывается путем статистической проверки с помощью описанного ниже критерия n1/2V, значение которого для данных табл.4 равно 1,866.
Табл. 4. Результаты 1000 испытаний
по двум альтернативным признакам (случай независимости)
Х=0 Х=1 Всего У=0 909 43 952 У=1 43 5 48 Всего 952 48 1000
Согласно данным табл.4, входной уровень дефектности для каждого из двух альтернативных признаков по-прежнему равен 0,048, в то время как для изделий в целом он равен 0,091, т.е. на 5,5% меньше, чем в случае несовместности, и на 47% больше, чем в случае поглощения.
Проблема состоит в том, что таблицы и стандарты по статистическому приемочному контролю относятся обычно к случаю одного контролируемого параметра. А как быть, если контролируемых параметров несколько? Приведенные выше примеры показывают, что входной уровень дефектности изделия в целом не определяется однозначно по входным уровням дефектности отдельных его параметров.
Как должны соотноситься характеристики планов контроля по отдельным признакам с характеристиками плана контроля по двум (или многим) признакам одновременно? Рассмотрим распространенную рекомендацию - складывать уровни дефектности, т.е. считать, что уровень дефектности изделия в целом равен сумме уровней дефектности по отдельным его параметрам. Она, очевидно, опирается на гипотезу несовместности дефектов, а потому во многих случаях преувеличивает дефектность, а потому ведет к использованию излишне жестких планов контроля, что экономически невыгодно.
Зная специфику применяемых технологических процессов, в ряде конкретных случаев можно предположить, что дефекты по различным признакам возникают независимо друг от друга. Это предположение необходимо обосновывать по статистическим данным. Если же оно обосновано, следует рассчитывать входной уровень дефектности по формуле
1 - p00 = p1 + p2 - p1p2 ,
соответствующей независимости признаков.
Итак, необходимо уметь проверять по статистическим данным гипотезу независимости двух альтернативных признаков. Речь идет о статистической проверке нулевой гипотезы
Н0: p11 = p1 p2 (22)
(что эквивалентно проверке равенства p00 = (1 - p1)(1 - p2)). Нетрудно проверить, что гипотеза о справедливости равенства (22) эквивалентна гипотезе
Н0 : p00 p11 - p10 p01 = 0. (23)
В простейшем случае предполагается, что проведено n независимых испытаний (Xi , Yi), i = 1,2,...,n, в каждом из которых проконтролированы два альтернативных признака, а вероятности результатов контроля не меняются от испытания к испытанию. Общий вид статистических данных приведен в табл.5.
Табл. 5. Общий вид результатов контроля
по двум альтернативным признакам.
Х=0 Х=1 Всего У=0 a b a+b У=1 c d c+d Всего a+c b+d n
В табл.5 величина a - число испытаний, в которых (Xi , Yi) = (0,0), величина b - число испытаний, в которых (Xi , Yi) = (1,0), и т.д.
Случайный вектор (a, b, c, d) имеет мультиномиальное распределение с числом испытаний n и вектором вероятностей исходов (p00 , p10 , p01 , p11 ). Состоятельными оценками этих вероятностей являются дроби a/n, b/n, c/n, d/n соответственно. Следовательно, критерий проверки гипотезы (23) может быть основан на статистике
Z = ad - bc . (24)
Как вытекает из известной формулы для ковариаций мультиномиального вектора (см., например, формулу (6.3.5) в учебнике С.Уилкса [14] на с. 153),
М(Z) = n (p10 p01 - p00 p11), (25)
что равно 0 при справедливости гипотезы независимости (23).
Связь между переменными X и Y обычно измеряется коэффициентом, отличающимся от Z нормирующим множителем:
V = (ad - bc) { (a + b)(a + c)(b + d)(c + d) } - 1/2 (26)
(см. классическую монографию М. Дж. Кендалла и А. Стьюарта [15, с.723], на которую уже были ссылки, в частности, в главе 5). При справедливости гипотезы Н0 и больших n случайная величина nV2 имеет хи-квадрат распределение с одной степенью свободы, а n1/2V имеет стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1 (см. [15, с.736]).
Рассмотрим еще один пример. Пусть проведено 100 испытаний, результаты которых описаны в табл.6. Тогда
V = (50 . 20 - 10 . 20) (60 . 70 . 30 . 40)-1/2 =
= (1000 - 200) . 5940000-1/2 = 800 / 2245 = 0,35635,
n1/2V = 3,5635 .
Табл. 6. Результаты 100 испытаний
по двум альтернативным признакам.
Х=0 Х=1 Всего У=0 50 10 60 У=1 20 20 40 Всего 70 30 100
Поскольку полученное значение n1/2V превышает критическое значение при любом применяемом в статистике уровне значимости, то гипотезу о независимости признаков необходимо отклонить.
К сожалению, приведенный простой метод годится не всегда. При статистическом анализе реальных данных возникают проблемы, связанные с отсутствием достаточно больших однородных выборок, т.е. выборок, в которых постоянны параметры вероятностных распределений. Реально единицы продукции представляются на контроль партиями, из каждой партии контролируются лишь несколько изделий, т.е. малая выборка. При этом от партии к партии меняются параметры p00, p10, p01, p11, описывающие уровень дефектности. Поэтому необходимы статистические методы, позволяющие проверять гипотезу независимости признаков по совокупности малых выборок. Построим один из возможных методов.
Рассмотрим вероятностную модель совокупности k малых выборок объемов n1 , n2 ,..., nk соответственно. Пусть j -я выборка (Xjt , Yjt), t = 1, 2,..., nj , имеет распределение, задаваемое вектором параметров (p00j, p10j, p01j, p11j) в соответствии с ранее введенными обозначениями, j = 1,2,...,k . Будем проверять гипотезу
Н0: p11j = (p10j + p11j) (p01j + p11j), j = 1,2,...,k, (27)
или в эквивалентной формулировке
Н0 : p11j p00j - p10j p01j , j = 1,2,...,k . (28)
Основная идея состоит в нахождении асимптотического распределения статистики типа n1/2V при росте числа k малых выборок, а именно, статистики
S = g1 Z1 + g2 Z2 + ... + gk Zk , (29)
где Z1 , Z2 ,..., Zk - статистики, рассчитанные по формуле (24) для каждой из k выборок, т.е. Zj = ajdj - bjcj , j = 1,2,...,k, а g1 , g2 , ... , gk - некоторые весовые коэффициенты, которые, в частности, могут совпадать. Поскольку
М(S) = g1 М(Z1) + g2 М(Z2) + ... + gk М(Zk), (30)
то при справедливости гипотезы независимости (27) - (28) имеем М(S) = 0 согласно соотношению (25). Поскольку слагаемые в сумме (29) независимы, то при росте k случайная величина S в силу Центральной Предельной Теоремы является асимптотически нормальной. Дисперсия этой величины равна сумме дисперсий слагаемых:
D(S) = g12 D(Z1 ) + g22 D(Z2) + ... + gk2 D(Zk) . (31)
Для оценивания дисперсии S необходимо использовать несмещенные оценки дисперсий в каждой из k выборок (и в этом одна из основных "изюминок" разбираемого метода). Предположим, что построены статистики Tj такие, что
М(Tj) = D(Zj) , j = 1,2,...,k . (32)
Тогда при некоторых математических "условиях регулярности", на которых нет необходимости здесь останавливаться, несмещенная оценка дисперсии статистики S, имеющая согласно формулам (31) и (32) вид
L = g12 T1 + g22 T2 + ... + gk2 Tk , (33)
в силу закона больших чисел такова, что дробь D(S) / L приближается к 1 при росте числа выборок (сходимость по вероятности). Отсюда следует, что распределение случайной величины Q = S L-1/2 приближается при росте числа выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Следовательно, критерий проверки гипотезы (27) - (28) независимости признаков, состоящий в том, что при - 1,96 < Q < 1,96 гипотеза принимается, а при Q , выходящих за пределы интервала (- 1,96; 1,96) , гипотеза отклоняется, имеет уровень значимости, приближающийся к 0,05 при росте числа выборок. Мощность этого критерия зависит от величины М(S)D(S)-1/2 при альтернативе.
Для реализации намеченного плана осталось научиться несмещенно оценивать D(Zj). К сожалению, в литературе по несмещенному оцениванию не рассматривают случай мультиномиального распределения, поэтому кратко опишем процедуру построения несмещенной оценки D(Zj). Поскольку согласно формулам (24) и (25)
D(Zj) = М( Zj2 ) - (М( Zj ))2 = М (aj2dj2) - 2 М (ajbjcjdj) +
+ М (bj2cj2) + nj2 (p11j p00j - p10j p01j)2, (34)
то для вычисления D(Zj) достаточно найти входящие в правую часть формулы (34) начальные смешанные моменты мультиномиального распределения (четвертого порядка). Теоретически это просто - известен вид характеристической функции мультиномиального распределения (см., например, формулу (6.3.4) в монографии [14, с.152]), а начальные смешанные моменты равны значениям ее соответствующих производных в 0, деленным на нужную степень мнимой единицы (формула (5.2.3) в монографии [4, с.131]). Например, с помощью описанной процедуры после некоторых вычислений получаем, что (для упрощения записи здесь и далее опустим индекс j)