МЕТОДЫ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

Лекция 7

Тема. МЕТОДЫ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

Цель. Дать понятие о статистических решениях для одного диагностического параметра и для принятия решения при наличии зоны неопределенности.

Учебная. Разъяснить процесс принятия решения в различных ситуациях.

Развивающая. Развивать логическое мышление и естественное - научное мировоззрение.

Воспитательная. Воспитывать интерес к научным достижениям и открытиям в отрасли телекоммуникации.

Межпредметные связи:

Обеспечивающие: информатика, математика, вычислительная техника и МП, системы программирования.

Обеспечиваемые: Стажерская практика

Методическое обеспечение и оборудование:

Методическая разработка к занятию.

Учебный план.

Учебная программа

Рабочая программа.

Инструктаж по технике безопасности.

Технические средства обучения: персональный компьютер.

Обеспечение рабочих мест:

Рабочие тетради

Ход лекции.

Организационный момент.

Анализ и проверка домашней работы

Ответьте на вопросы:

  1. Что позволяет определить формула Байеса?
  2. В чем состоят основы метода Байеса? Приведите формулу. Дайте определение точного смысла всех входящих в эту формулу величин.
  3. Что означает, что реализация некоторого комплекса признаков K* является детерминирующей?
  4. Объясните принцип формирования диагностической матрицы.
  5. Что означает решающее правило принятия?
  6. Дайте определение методу последовательного анализа.
  7. В чем состоит связь границ принятия решения с вероятностями ошибок первого и второго рода?

План лекции

  1. СТАТИСТИЧЕСКИЕ РЕШЕНИЯ ДЛЯ ОДНОГО ДИАГНОСТИЧЕСКОГО ПАРАМЕТРА
  2. СТАТИСТИЧЕСКИЕ РЕШЕНИЯ ПРИ НАЛИЧИИ ЗОНЫ НЕОПРЕДЕЛЕННОСТИ И ДРУГИЕ ОБОБЩЕНИЯ

Рассматриваемые методы относятся к статистическим. В методах статистических решений решающее правило выбирается исходя из некоторых условий оптимальности, например из условия минимума риска. Возникшие в математической статистике как методы проверки статистических гипотез (работы Неймана и Пирсона), рассматриваемые методы нашли широкое применение в радиолокации (обнаружение сигналов на фоне помех), радиотехнике, общей теории связи и других областях. Методы статистических решений успешно используются в задачах технической диагностики.

СТАТИСТИЧЕСКИЕ РЕШЕНИЯ ДЛЯ ОДНОГО ДИАГНОСТИЧЕСКОГО ПАРАМЕТРА

Если состояние системы характеризуется одним параметром, то система имеет одномерное пространство признаков. Разделение производится на два класса (дифференциальная диагностика или дихотомия (раздвоенность, последовательное деление на две части, не связанные между собой.)).

Рис.1 Статистические распределения плотности вероятности диагностического параметра х для исправного D1 и дефектного D2 состояний


Существенно, что области исправного D1 и дефектного D2 состояний пересекаются и потому принципиально невозможно выбрать значение х0, при котором не было бы ошибочных решений. Задача состоит в том, чтобы выбор х0 был в некотором смысле оптимальным, например давал наименьшее число ошибочных решений.

Ложная тревога и пропуск цели (дефекта).Эти встречавшиеся ранее термины явно связаны с радиолокационной техникой, но они легко интерпретируются в задачах диагностики.

Ложной тревогой называется случай, когда принимается решение о наличии дефекта, но в действительности система находится в исправном состоянии (вместо D1 принимается D2).

Пропуск цели (дефекта) — принятие решения об исправном состоянии, тогда как система содержит дефект (вместо D2 принимается D1).

В теории контроля эти ошибки называются риском поставщика и риском заказчика. Очевидно, что эти двоякого рода ошибки могут иметь различные последствия или различные целы.

Вероятность ложной тревоги равна вероятности произведения двух событий: наличие исправного состояния и значения х > х0.

Средний риск. Вероятность принятия ошибочного решения слагается из вероятностей ложной тревоги и пропуска дефекта (математическое ожидание) риска.

Разумеется, цена ошибки имеет условное значение, но она должна учесть предполагаемые последствия ложной тревоги и пропуска дефекта. В задачах надежности стоимость пропуска дефекта обычно существенно больше стоимости ложной тревоги.

Метод минимального риска. Вероятность принятия ошибочного решения определяется как минимизация точки экстремума среднего риска ошибочных решений при максимуме правдоподобия т.е. проводится расчет минимального риска происхождения события при налички информации о максимально подобных событиях.

рис. 2. Точки экстремума среднего риска ошибочных решений

Рис. 3. Точки экстремума для двугорбых распределений

Отношение плотностей вероятностей распределения х при двух состояниях называется отношением правдоподобия.

Напомним, что диагноз D1 соответствует исправному состоянию, D2 — дефектному состоянию объекта; С21 — цена ложной тревоги, С12 — цена пропуска цели (первые индекс — принятое состояние, второй — действительное); С11 < 0, С22 < 0 — цены правильных решений (условные выигрыши). В большинстве практических задач условные выигрыши (поощрения) для правильных решений не вводятся.

Часто оказывается удобным рассматривать не отношение правдоподобия, а логарифм этого отношения. Это не изменяет результата, так как логарифмическая функция возрастает монотонно вместе со своим аргументом. Расчет для нормального и некоторых других распределений при использовании логарифма отношения правдоподобия оказывается несколько проще. Условие минимума риска можно получить из других соображений, которые окажутся важными в дальнейшем.

Метод минимального числа ошибочных решений.

Вероятность ошибочного решения для решающего правила

В задачах надежности рассматриваемый метод часто дает «неосторожные решения», так как последствия ошибочных решений существенно различаются между собой. Обычно цена пропуска дефекта существенно выше цены ложной тревоги. Если указанные стоимости приблизительно одинаковы (для дефектов с ограниченными последствиями, для некоторых задач контроля и др.) то применение метода вполне оправдано.

Метод минимакса предназначен для ситуации, когда отсутствуют предварительные статистические сведения о вероятности диагнозов D1 и D2. Рассматривается «наихудший случай», т. е. наименее благоприятные значения Р1 и Р2, приводящие к наибольшему значению (максимуму) риска.

Можно показать для одномодальных распределений, что величина риска становится минимаксной (т. е. минимальной среди максимальных значений, вызванных «неблагоприятной» величиной Pi). Отметим, что при Р1 = 0 и Р1 = 1 риск принятия ошибочного решения отсутствует, так как ситуация не имеет неопределенности. При Р1 = 0 (все изделия неисправны) вытекает х0 -оо и все объекты действительно признаются неисправными; при Р1 = 1 и Р2 = 0 х0 +оо и в соответствии с имеющейся ситуацией все объекты классифицируются как исправные.

Для промежуточных значений 0 < Pi < 1 риск возрастает и при P1= P1* становится максимальным. Рассматриваемым методом выбирают величину х0 таким образом, чтобы при наименее благоприятных значениях Pi потери, связанные с ошибочными решениями, были бы минимальными.

рис. 4. Определение граничного значения диагностического параметра по методу минимакса

Метод Неймана—Пирсона. Как уже указывалось, оценки стоимости ошибок часто неизвестны и их достоверное определение связано с большими трудностями. Вместе с тем ясно, что во всех случаях желательно при определенном (допустимом) уровне одной из ошибок минимизировать значение другой. Здесь центр проблемы переносится на обоснованный выбор допустимого уровня ошибок с помощью предыдущего опыта или интуитивных соображений.

По методу Неймана—Пирсона минимизируется вероятность пропуска цели при заданном допустимом уровне вероятности ложной тревоги. Таким образом, вероятность ложной тревоги

где А — заданный допустимый уровень вероятности ложной тревоги; Р1 — вероятность исправного состояния.

Отметим, что обычно это условие относят к условной вероятности ложной тревоги (множитель Р1 отсутствует). В задачах технической диагностики значения Р1 и Р2 в большинстве случаев известны по статистическим данным.

Таблица 1 Пример - Результаты расчета по методам статистических решений

№ п/п

Метод

Граничное значение

Вероятность ложной тревоги

Вероятность пропуска дефекта

Средний риск

1

Метод минимального риска

7,46

0,0984

0,0065

0,229

2

Метод минимального числа ошибок

9,79

0,0074

0,0229

0,467

3

Метод минимакса

Основной вариант

5,71

0,3235

0,0018

0,360

4

2 вариант

7,80

0,0727

0,0081

0,234

5

Метод Неймана—Пирсона

7,44

0,1000

0,0064

0,230

6

Метод наибольшего правдоподобия

8,14

0,0524

0,0098

0,249

Из сопоставления видно, что метод минимального числа ошибок дает неприемлемое решение, так как цены ошибок существенно различны. Граничное значение по этому методу приводит к значительной вероятности пропуска дефекта. Метод минимакса в основном варианте требует очень большого снятия с эксплуатации исследуемых устройств(примерно 32%), так как исходит из наименее благоприятного случая (вероятность неисправного состояния Р2 = 0,39). Применение метода может быть оправданным, если отсутствуют даже косвенные оценки вероятности неисправного состояния. В рассматриваемом примере удовлетворительные результаты получаются по методу минимального риска.

  1. СТАТИСТИЧЕСКИЕ РЕШЕНИЯ ПРИ НАЛИЧИИ ЗОНЫ НЕОПРЕДЕЛЕННОСТИ И ДРУГИЕ ОБОБЩЕНИЯ

Правило решения при наличии зоны неопределенности.

В некоторых случаях, когда требуется высокая надежность распознавания (большая стоимость ошибок пропуска цели и ложной тревоги), целесообразно ввести зону неопределенности (зону отказа от распознавания). Правило решения будет следующим

при отказ от распознавания.

Разумеется, отказ от распознавания является нежелательным событием. Он свидетельствует, что имеющейся информации недостаточно для принятия решения и нужны дополнительные сведения.

рис. 5. Статистические решения при наличии зоны неопределенности

Определение среднего риска. Величина среднего риска при наличии зоны отказа от распознавания может быть выражена следующим равенством

где Co — цена отказа от распознавания.

Отметим, что Со > 0, иначе задача теряет смысл («вознаграждение» за отказ от распознавания). Точно так же С11 < 0, С22 < 0, так как правильные решения не должны «штрафоваться».

Метод минимального риска при наличии зоны неопределенности. Определим границы области принятия решения, исходя из минимума среднего риска.

Если не поощрять правильные решения (С11 = 0, С22 = 0) и не платить за отказ от распознавания (С0 = 0), то область неопределенности будет занимать всю область изменения параметра.

Наличие зоны неопределенности дает возможность обеспечить заданные уровни ошибок за счет отказа от распознавания в «сомнительных» случаях

Статистические решения для нескольких состояний. Выше были рассмотрены случаи, когда статистические решения принимались для различения двух состояний (дихотомия). Принципиально такая процедура позволяет провести разделение на n состояний, каждый раз объединяя результаты для состояния D1 и D2. Здесь под D1 понимаются любые состояния, соответствующие условию «не D2». Однако в некоторых случаях представляет интерес рассмотреть вопрос и в прямой постановке — статистические решения для классификации n состояний.

Выше рассматривались случаи, когда состояние системы (изделия) характеризовалось одним параметром х и соответствующим (одномерным) распределением. Состояние системы характеризуется диагностическими параметрами х1 х2, ..., хn или вектором х:

х=(х1 х2,...,хn).

Метод минимального риска.

Наиболее просто обобщаются на многомерные системы методы минимального риска и его частные случаи (метод минимального числа ошибочных решений, метод наибольшего правдоподобия). В случаях, когда в методе статистического решения требуется определение границ области принятия решения, расчетная сторона задачи существенно осложняется (методы Неймана—Пирсона и минимакса).

Домашнее задание: § конспект.

Закрепление материала:

Ответьте на вопросы:

  1. Что называют ложной тревогой?
  2. Что подразумевает пропуск цели (дефекта)?
  3. Дайте объяснение риску поставщика и риску заказчика.
  4. Приведите формулу метода минимального числа ошибочных решений. Дайте определение неосторожного решения.
  5. Для каких случаев предназначен метод минимакса?
  6. Метод Неймана—Пирсона. Объясните его принцип.
  7. Для каких целей применяется зона неопределенности?

Литература:

Амренов С. А. «Методы контроля и диагностики систем и сетей связи» КОНСПЕКТ ЛЕКЦИЙ -: Астана, Казахский государственный агротехнический университет, 2005 г.

И.Г. Бакланов Тестирование и диагностика систем связи. - М.: Эко-Трендз, 2001.

Биргер И. А. Техническая диагностика.— М.: «Машиностроение», 1978.—240,с, ил.

АРИПОВ М.Н , ДЖУРАЕВ Р.Х., ДЖАББАРОВ Ш.Ю. «ТЕХНИЧЕСКАЯ ДИАГНОСТИКА ЦИФРОВЫХ СИСТЕМ» -Ташкент, ТЭИС, 2005

Платонов Ю. М., Уткин Ю. Г. Диагностика, ремонт и профилактика персональных компьютеров. -М.: Горячая линия - Телеком, 2003.-312 с: ил.

М.Е.Бушуева, В.В.Беляков Диагностика сложных технических систем Труды 1-го совещания по проекту НАТО SfP-973799 Semiconductors. Нижний Новгород, 2001

Малышенко Ю.В. ТЕХНИЧЕСКАЯ ДИАГНОСТИКА часть I конспект лекций

Платонов Ю. М., Уткин Ю. Г.Диагностика зависания и неисправностей компьютера/Серия «Техномир». Ростов-на-Дону: «Феникс», 2001. — 320 с.

PAGE \* MERGEFORMAT 2

МЕТОДЫ СТАТИСТИЧЕСКИХ РЕШЕНИЙ