Разработка и исследование способа обнаружения аномальных значений

Содержание

Основная часть

Выводы

Библиографический список

аномальное аппаратура оборудование радиосигнал

При регистрации, обработке и обмене данными в современных измерительно-вычислительных и информационных системах потоки сигналов искажены действием помех (шумов), природа возникновения которых различна и зачастую носит случайный характер. Шумовая составляющая может содержать и аномальные значения. Для решения задачи выделения полезной составляющей нестационарного случайного процесса применяются различные классические процедуры фильтрации, результаты которых зависят от наличия в исследуемом процессе аномальных значений.

Аномальными называют значения, резко отличающиеся по величине и статистическим свойствам на фоне основной группы значений реализации процесса. Природа возникновения и источники аномальных значений различны, это может быть импульсная помеха, кратковременные повышения уровня шумов на входах приемников, сбой в работе регистрирующей аппаратуры, отказ оборудования, кратковременное внешнее воздействие на измерительный элемент, ВлзалипаниеВ» разряда цифрового счетчика, атмосферные воздействия при передаче радиосигналов, индустриальные помехи и т.д.

До недавнего времени на практике для обнаружения аномальных значений широко применялись ручные способы, основанные на визуальном просмотре зарегистрированных реализаций нестационарных случайных процессов и сравнение их с контрольными реализациями известной формы. Помимо субъективизма в критериях обнаружения аномальных значений, основанных, главным образом, на опыте и интуиции экспериментатора, подобные способы не допускают автоматизации процедур обработки исследуемых реализаций.

Для преодоления отмеченных недостатков, как показано в работах [1, 2], предлагается использовать теорию статистических решений, которая позволяет формализовать алгоритмы проверок и выбрать критерий обнаружения аномальных значений. Возможно применение как параметри-ческих, так и непараметрических методов теории решения. В первом случае необходимо располагать априорными сведениями как о функции полезной составляющей, так и о законе распределения шумовой составляющей, а также и о его параметрах (математическом ожидании, дисперсии, корреляционной функции). Использование непараметрических методов обработки требует значительно меньше априорной информации, но их эффективность определяется параметрами обработки, которые, в свою очередь, зависят от функции полезной и закона распределения шумовой составляющих процесса.

В связи с этим значительный интерес представляет разработка и исследование способа обнаружения аномальных значений при анализе нестационарных случайных процессов, представленных единственной реализацией.

В работах [3, 4] представлен метод выделения полезной составляющей нестационарного случайного процесса, который имеет высокую эффективность в условияхВа априорной неопределенности. Суть метода состоит в размножении не самой реализации исходного процесса, а оценок, получаемых определенным образом. Автор работ [3, 4], основываясь на основных принципах метода размножения оценок, предлагает и метод обнаружения аномальных значений при анализе нестационарных случайных процессов. В работах [3, 4, 5, 6 и др.] аналитически определены значения основных параметров метода обнаружения аномальных значений и показана его эффективность при анализе как стационарных, так и нестационарных случайных процессов с аддитивной шумовой составляющей.

К одному из достоинств метода обнаружения аномальных значений можно отнести также следующее: применение двухпорогового критерия принятия решения об аномальности значения процесса позволяет получить результаты,Ва при которых с увеличением величины аномальных значений, выборочные значения вероятности ошибки первого рода Вастремятся к минимальным значениям, в то время как выборочные значения вероятности правильного обнаружения Вастремятся к максимальным значениям [4, 5, 6].

Наряду с достоинствами предлагаемого метода обнаружения аномальных значений, представленного в работах [4, 5], выявлено, что он обладает весьма существенными недостатками, одним из которых является зависимость порогового значения от некоторого постоянного коэффициента . Правильный выбор коэффициента Вапозволит повысить эффективность обнаружения аномальных значений.

Поэтому в данной работе на основе проведенных исследований предлагается модификация уже существующего метода обнаружения аномальных значений, которая заключается в выборе правила определения коэффициента Вапри задании порогового значения.

Модификация предлагаемого в работе способа обнаружения аномальных значений предполагает введение адаптации порогового значения относительно коэффициента Вапри априорно фиксированном значении вероятности ошибки первого рода .

Предлагаемый в данной работе способ предполагает наличие единственной дискретной реализации исследуемого нестационарного случайного процесса . Априорная информация об исследуемом процессе заключается в том, что на некоторых интервалах времени полезная составляющая процесса является гладкой функцией [6], т.е. достаточно точно описывается полиномом не выше второй степени:

.ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (1)

Реализация исследуемого процесса разбивается на интервалы случайной длины, получаемые следующим образом: с помощью генератора случайных чисел, равномерно распределенных в интервале (0;1), получают Вачисел . Используя выражение , осуществляется взаимнооднозначное отображение промежутка (0;1) на интервале значений исследуемого нестационарного случайного процесса , получая при этом соответствующее разбиение числами Вапромежутка Вана Ванепересекающихся интервалов, где

Ва, .ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (2)

Вводятся обозначения для интервалов разбиения:

,Ва , тАж,Ва Ва.(3)

Каждый интервал разбиения Васодержит не менее Ваотсчетов (минимальная длина интервала разбиения) исходного нестационарного случайного процесса из набора , в противном случае случайные числа, формирующие данный интервал разбиения , отбрасываются и генерируются заново. Наличие этого условия означает, что .

Для получения каждой новой оценки процедура разбиения отрезка Вана Ваинтервалов случайной длины (с проверкой выше указанного условия) повторяется. В результате получаем Варазбиений временного отрезка Ва[7] .

ВаВаВатАжВаВа

ВаВаВатАжВаВа .ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (4)

ВаВаВатАжВаВа

На каждом интервале разбиения , где Ваи , с помощью метода наименьших квадратов находятся оценки , , Вакоэффициентов аппроксимирующего полинома Вакак решение системы линейных уравнений:

ВаВаВаВаВаВаВаВаВаВаВа (5)

где символ означает суммирование по всем -м значения, которые принадлежат интервалу разбиения Ваи , .

Результатом действия способа будет набор определенных на отрезке Васглаживающих функций , где , каждая из которых является Влкусочно-квадратичнойВ»:

(6)

где , Ваи .

Определяются значения разности Вамежду исходным нестационарным случайным процессомВа Ваи оценкой сглаживающих функций :

, .(7)

При оценке параметров разностного процесса Вана каждом интервале разбиения Ваиспользуется один из методов робастного оценивания [8], т.е. оценка параметровВа математического ожидания Ваи среднеквадратического отклонения Вапроизводится по -усеченной выборке. Для этого на каждом интервале разбиения Ваполучаем ряд ранжированных значений иВа оценку математического ожидания Ваи среднеквадратического отклонения , которая проводится без учета первого и последнего значения ранжированного ряда. Тогда выражения для оценок математического ожидания Ваи среднеквадратического отклонения Вапринимают следующий вид [9]:

ВаиВа ,(8)

гдеВаВа .Далее на каждом интервале разбиения исследуемого нестационарного случайного процесса устанавливаетсяВа пороговое значение

,ВаВаВаВаВаВа (9)

где ВатАУ некоторый коэффициент, Ваи . Превышение значений разностного процесса Вана каждом интервале разбиения установленного порогового значения (9) штрафуется, т.е. если выполняется условие:

,ВаВаВаВа ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа(10)

то Ваполучает одно штрафное значение. В соответствии с методом размножения оценок [4] вышеизложенная процедура определения штрафов повторяется р раз и для каждого повторения проверяется условие (10) для каждого значения , где ; ;; ВатАУ объем выборки исследуемого нестационарного случайного процесса; ВатАУ количество интервалов разбиения; тАУ количество повторений процедур (2)тАУ(10).

Таким образом, происходит накопление ряда штрафных значений для элементов исходной реализации исследуемого процесса, т.е.:

,ВаВаВаВаВа (11)

где тАУ ряд штрафных значений Ваи ,.

По окончанию обработки для всех оштрафованных значений исходной реализации определяется суммарное значение штрафов Ваи максимальное значение ряда . Далее проверяется условие:Ва если

,Ва (12)

то k-е значение из входной реализации нестационарного случайного процесса Вабудет трактоваться как аномальное. Условие (12) получено на основе проведения имитационного моделирования при различных моделях полезной и шумовой составляющих нестационарного случайного процесса.

Для случая обнаружения аномальных значений в реализации нестационарного случайного процесса выбирать значение коэффициента Ватолько по оценкам среднеквадратического отклонения шумовой составляющей процесса является нецелесообразным, так как наличие аномальных значений существенно влияет на погрешность оценки полезной составляющей процесса и, как следствие, на оценку среднеквадратического отклонения разностного процесса. Следует также отметить, что на каждом интервале разбиения значение коэффициента Ване может быть фиксированным.

В связи с этим предлагается ввести адаптацию порогового значения о назначении штрафов (9) по коэффициенту Ваотносительно априорно фиксированного значения вероятности ошибки первого рода. С этой цельюВа проведены исследования зависимостиВа коэффициента Ваот объема выборки , от значения среднеквадратического отклонения случайного процесса Вадля различных стационарных процессов при априорно фиксированных значениях вероятности ошибки первого рода .

В результате получены зависимости выборочных значений коэффициента Ваот объема исследуемой выборки и среднеквадратического отклонения шумовой составляющей процесса, то есть . Входная реализация представляет собой стационарный центрированный гауссовский случайный процесс. Исследования проводились на выборках объемом = 5, 7, 9, 11, 13 и 15 значений и среднеквадратическом отклонении случайного процесса = 0,1тАУ0,5. В результатеВа проведенных исследований были получены зависимости выборочных значений коэффициента Вапри различных априорно фиксированных значениях вероятности ошибки первого рода . Усреднение значенийВа коэффициента Вапроизводилось по 1 000 выборок [10, 11, 12].

На рис. 1 приведены графики зависимости выборочных значений коэффициента Вадля объема выборки ВаиВа среднеквадратического отклонения случайного процесса Вапри априорно фиксированных значениях вероятности ошибки первого рода Ва(при =0,05 тАУ рис. 1а, при =0,1 тАУ рис. 1б).

а)ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа б)

Рис. 1. Зависимость Вадля гауссовского закона плотности распределения вероятности случайного процесса: а тАУ при ; б тАУ при

Из анализа полученных зависимостей, представленных на рис. 1, следует, что при различных фиксированных значениях вероятности ошибки первого рода Вас увеличением объема выборки Вавыборочные значения коэффициента Вастремится к некоторому постоянному значению и практически не зависит от значения среднеквадратического отклонения случайного процесса. Выборочные значения коэффициента ВадляВа выборок Вавозрастают в среднем на 5 %.

Также приведены результатыВа исследований зависимости коэффициента Ваот объема выборки Ваи среднеквадратического отклонения , когда стационарный случайный процесс представлен равномерным и рэлеевским законами распределения. Результаты полученных зависимостей представлены на рис. 2а тАУ для равномерного и на рис. 2б тАУ для рэлеевского законов плотности распределения вероятности случайного процесса, при априорно фиксированном значении ошибки первого рода =0,05.

а)ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа б)

Рис. 2. Зависимость ВаприВа :

а тАУ для равномерного закона;

б тАУ для рэлеевского законов плотности распределения вероятности случайных процессов

Из анализа графиков, представленных на рис. 2а и б, видно, что выборочные значения коэффициента Вапрактически не зависят от среднеквадратического отклонения стационарного случайного процесса Ваи незначительно зависит от объема исследуемой выборки .

Таким образом, проведенные исследования показывают, что выборочные значения коэффициента Вадля рассмотренных законов распределения случайных процессов практически не зависят от объема исследуемой выборки Ваи среднеквадратического отклонения стационарного случайного процесса , а зависят только от априорно задаваемого значения вероятности ошибки первого рода Ва[10, 11, 12]. В связи с этим исследуются зависимости выборочных значений коэффициента Ваот априорно фиксированного значения вероятности ошибки первого рода , т.е. , для различных законов плотности распределения вероятности стационарных случайных процессов (гауссовского, равномерного, рэлеевского) при значении . Результаты, которые представлены на рис. 3, получены при , Ваи .

На рис. 3 приведены зависимости значения оценок коэффициента Ваот вероятности ошибки первого рода : график 1 тАУ рэлеевский; график 2 тАУ равномерный и график 3 тАУ гауссовский законы плотности распределения вероятности стационарного случайного процесса.

Рис. 3. Зависимость Вадля различных законов распределения случайных процессов

Из анализа графиков, представленных на рис. 3, следует, что выборочные значения коэффициента Вадля всех представленных законов распределения стационарного случайного процесса существенно зависят от априорно задаваемых значений вероятности ошибки первого рода .

На рис. 4 представлен усредненный график зависимостиВа Вадля исследуемых стационарных случайных процессов.

Рис. 4. Усредненная зависимость Вадля рассмотренных стационарных случайных процессов

Графическая зависимость, представленная на рис. 4, может быть аппроксимирована полиномом второй степени вида [6, 7]:

.ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (13)

Полученные результаты исследования зависимости коэффициентаВа Вапозволяют при адаптации порогового значения (9) вместо постоянного значения коэффициента Ваиспользовать его значение, которое вычисляется в соответствии с (13). Использование уравнения (13) в оценке порогового значения (9) позволяет использовать предложенный способ обнаружения аномальных значений при фиксированном значении вероятности ошибки первого рода .

Для исследования эффективности способа обнаружения аномальных значений с адаптацией порогового значения проводится сравнительныйВа анализ предлагаемого способа и способа обнаружения аномальных значений без адаптации порогового значения.

Критерием эффективности предлагаемого в данной работе способа обнаружения аномальных значений в реализации нестационарного случайного процесса выступают выборочные значения вероятности правильного обнаружения Ваи вероятности ошибки первого рода . Вероятность ошибки первого рода Ва(вероятность ложной тревоги) определяет вероятность принятия значения процесса за аномальное значение. Вероятность правильного обнаружения Ваопределяет вероятность правильного решения о наличии аномального значения в исходной реализации нестационарного случайного процесса. Использование вышесказанного критерия для оценки эффективности предлагаемыхВа в работе способа осуществляются по усредненным значениям, т.е. в качестве выборочных значений вероятности правильного обнаружения , и вероятности ошибки первого рода Варассмотрены их средние значения, полученные по множеству реализаций (порядка 1 000).

В данной работе исследуются модели нестационарных процессов, которые представляют собой единственную реализацию дискретного процесса , полученного в равноотстоящие моменты времени , где Ваи , т.е. модели вида [3]:

,ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (14)

,ВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВаВа (15)

где ,, , ВатАУ полезная, аддитивная, мультипликативная шумовая и аномальная составляющие входного процесса соответственно, где , тАУ объем выборки исследуемого процесса.

Исследование для нестационарных случайных процессов проводятся, когда полезная составляющая процесса Вапредставлена простыми моделями функций: гармонической, экспоненциальй, полиномиальными, а также составной и сложной моделями. Составная модель функции исследуемого процесса состоит изВа параболы, синусоиды, константы и экспоненты тАУ модель огибающая радиоимпульса на выходе резонансного усилителя при расстройке относительно резонансной частоты. Модель сложной функции представляет собой сумму некоторой константы и синусоиды.

Шумовая составляющая процесса представлена гауссовским, равномернымВа и рэлееевским законами плотности распределения вероятности.ВаВа В качестве аномальной составляющей процесса рассматривались одиночные аномального значения Вас различнойВа величиной Ваи местом расположения в выборке исследуемого нестационарного случайного процесса.

На основе имитационного моделирования в работах [3, 4] при анализе нестационарных случайных процессов получены зависимости выборочных значений вероятности ошибки первого рода Ваи вероятности правильного обнаружения Вадля способа обнаружения аномальных значений без адаптации, т.е. когда значение коэффициента Вав пороговом значении (9) задается фиксированным , и с адаптацией порогового значения (9), т.е. когда значение коэффициента Ваопределяется выражением Ва(13) [4].

Исследования эффективности предлагаемого способа проводятся для случая, когда модель нестационарного случайного процесса является аддитивной (14). АддитивнаяВа шумовая составляющая процесса Ваимеет гауссовский закон плотности распределения вероятности. Одиночные аномальные значения распределены равномерно по всей реализации нестационарного случайного процесса Ваи составляют 5 % от выборки N. Исследования проводятся для различных значений величины аномальных значений , т.е.: ,,,,, ВатАУ среднеквадратическое отклонение аддитивной шумовой составляющей. Значения вероятности ошибки первого рода для способа с адаптацией порогового значения априорно фиксируется .

В результате проведенных исследований для нестационарных случайныхВа процессов получены зависимости выборочных значений вероятности правильного обнаружения . Для случая, когда не используется адаптация порогового значения, тАУ графикиВа , , , , Ваи с применениемВа адаптация порогового значения тАУ графики 1, 2, 3, 4, 5 (рис. 5).

Рис. 5. Зависимость выборочных значений вероятности правильного обнаруженияВа Вадля способа без адаптации и способа с адаптацией порогового значения при

Зависимости Вана рис. 5 представленыВа для различных моделей функций полезной составляющей : графики 1, ВатАУ экспоненциальной; графики 2, ВатАУ параболической; графики 3, ВатАУ гармонической; графики 4, ВатАУ составной и графики 5, ВатАУВа сложной функции.

Анализ результатов, представленных на рис. 5, показывает, что при введении адаптации порогового значения выборочные значения вероятности правильного обнаружения Вавозрастают для всех рассмотренных функций полезной составляющей . Причем для параболической, гармонической и экспоненциальной модели функций, при величине аномальных значений порядка , выборочные значения вероятности правильного обнаружения Вавозрастают примерно на 66 %. С увеличением величины аномальных значений () выборочные значения вероятности правильного обнаружения Ваувеличиваются примерно на 54 %. Из анализа зависимостей Ватакже следует, что при использовании адаптации порогового значения, с увеличением величины аномальных значений , вероятность правильного обнаружения Ваасимптотически стремится к единице независимо от модели функции полезной составляющей Ва[4, 5].

Применяя адаптацию порогового значения, также получены зависимости выборочных значений вероятности ошибки первого рода , которые представлены на рис. 6.

Рис. 6. Зависимость выборочных значений ошибки первого рода Вадля способа с адаптацией порогового значенияВа при

Зависимости Вана рис. 6Ва представленыВа для следующих моделей функций полезной составляющей сигнала : график 1 тАУ параболической; график 2Ва тАУВа составной; график 3 тАУ экспоненциальной; график 4 тАУ гармонической; график 5 тАУВа сложной.

Из анализа полученных зависимостей Васледует, что при использовании адаптации порогового значения выборочные значения вероятности ошибки первого рода Вапрактически не превосходят априорно задаваемого значения, т.е. , для всех исследуемых нестационарных случайных процессов (рис. 6).

В данной работе также исследуется эффективность адаптивного способа обнаружения аномальных значенийВа в зависимости от места расположения аномальных значений в выборке нестационарного случайного процесса.

Рассматривается модель с аддитивной шумовой составляющей , закон плотности распределения вероятности которой является центрированным гауссовским случайным процессом со среднеквадратическим отклонением . В качестве модели функции полезной составляющей Ваиспользуются следующие нормированные функции: экспоненциальная, гармоническая, составная.

Аномальные значения с фиксированной величиной Васоставляют 5 % от объема исследуемой выборки . Рассматриваются случаи, когда аномальные значения располагаются в начале выборки, в середине выборки, в конце выборки и равномерно по всей выборке нестационарного случайного процессаВа , где .

В результате проведенных исследований получены выборочные значения вероятности правильного обнаружения Вадля случая без адаптации и с адаптацией порогового значения, которые представлены в табл. 1.

Таблица 1

Выборочные значения вероятности правильного обнаружения

Расположение аномальных значений	Гармоническая функция		Экспоненциальная функция		Составная функция
Расположение аномальных значений	с адаптацией порогового значения	без адаптации порогового значения	с адаптацией порогового значения	без адаптации порогового значения	с адаптацией порогового значения	без адаптации порогового значения
В начале выборки	0,796	0,457	0,861	0,204	0,694	0,199
В середине выборки	0,930	0,201	0,928	0,269	0,842	0,251
В конце выборки	0,898	0,252	0,925	0,254	0,828	0,241
Равномерно расположены по всей выборке	0,979	0,204	0,925	0,254	0,920	0,369

Вместе с этим смотрят:

GPS-навигация

IP-телефония. Особенности цифровой офисной связи

РЖсторiя звтАЩязку та його розвиток

Автоматика, телемеханика и связь

Анализ режимов автоматического управления