Реферат: Разработка подсистемы вывода в диагностической экспертной системе
Название: Разработка подсистемы вывода в диагностической экспертной системе Раздел: Рефераты по информатике, программированию Тип: реферат | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АННОТАЦИЯ дипломной работы студента 541-й группы II курса технического факультета ВКИ НГУ Добрынина Романа Валентиновича. «Разработка подсистемы вывода в диагностической экспертной системе». Тема проекта – «Разработка подсистемы вывода в диагностической экспертной системе». Данная дипломная работа была выполнена на кафедре систем информатики в лаборатории искусственного интеллекта Института Систем Информатики Сибирского Отделения Российской Академии Наук. (ИСИ СО РАН). Научный руководитель – Попов Иван Геннадьевич. Работа выполнялась с 1 сентября 1998 года по 30 мая 1999 года. Тип работы – инженерная; является плановой разработкой института. Задачей дипломной работы является разработка подсистемы вывода и обработки знаний в диагностической экспертной системе по медицинской диагностике. Особенностью создаваемой системы является возможность ее работы с нечеткими и неточными входными данными. При этом подсистема вывода будет использовать экспертные знания, также допускающие элементы нечеткости и неточности. Аналогом данной экспертной системы послужила известная в свое время экспертная система «Di-Gen», обеспечивающая медицинскую диагностику пациентов и техническую диагностику доменных печей. Данная же система аналогична предыдущим экспертным системам типа «Di-Gen»-а, но более современная, с эргономичным многоуровневым интерфейсом и разработана под операционную систему Windows 95/98. В рамках поставленной задачи работа была выполнена. В данный момент программа находится в стадии комплексного тестирования. Результаты предварительного тестирования выявили несколько недостатков и в данный момент идет работа по их устранению. ОТЗЫВ на дипломную работу студента II курса технического факультета ВКИ НГУ Добрынина Романа Валентиновича. «Разработка подсистемы вывода в диагностической экспертной системе». Данная дипломная работа проводилась в рамках разработки среды конструирования диагностических экспертных систем, ориентированной на задачи медицинской диагностики. Эта среда должна обеспечивать возможность создания баз знаний для разных областей медицинской диагностики, их просмотра и редактирования, и порождения на их основе специализированных диагностических систем. Одной из основных особенностей среды является возможность обработки неточной информации. Порожденная экспертная система должна обеспечивать полный цикл диагностики пациента, определение диагноза по введенным симптомам и ведения истории болезни. Экспертная система должна обладать удобным пользовательским интерфейсом и справочной системой. Задачей данной дипломной работы являлась разработка подсистемы вывода и обработки знаний в диагностической системе. Необходимо было разработать механизм логического вывода, который на основании введенных симптомов определял диагноз пациента. Этот вывод должен осуществляться в условиях неточной информации о наблюдаемых симптомах, обеспечивать интерактивный диалог с пользователем для их уточнения и производить ранжирование различных версий диагноза для определения наиболее вероятных. В целом, дипломник с задачей справился. Им были разработаны структура для представления базы знаний и модуль логического вывода для определения диагноза в условиях неточной информации о симптомах. Для этого использовался механизм связанных с симптомами весов и определение по ним вероятности выводимого диагноза. Для уточнения симптомов предусмотрены средства для ведения диалога с пользователем. Однако, следует отметить, что не все свойства симптомов, которые были бы полезны для определения диагноза, включаются в базу знаний и используются на этапе логического вывода, что в результате снижает точность определения диагноза. Следовало внимательнее изучить модели представления и обработки знаний, используемые в других системах этого класса. Учитывая вышесказанное, считаю, что работа заслуживает оценки "хорошо". Научный руководитель: м.н.с. РосНИИ ИИ /Попов И.Г./ ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ВЫСШЕМУ ОБРАЗОВАНИЮ НОВОСИБИРСКИЙ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ВЫСШИЙ КОЛЛЕДЖ ИНФОРМАТИКИ ТЕХНИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА СИСТЕМ ИНФОРМАТИКИ РАЗРАБОТКА ПОДСИСТЕМЫ ВЫВОДА В ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ ДИПЛОМНЫЙ ПРОЕКТ Пояснительная записка Листов 23 Студент Добрынин Роман Валентинович " " _______ 1999г Научный руководитель Попов Иван Геннадьевич, м.н.с. ИСИ СО РАН " " _______1999г Новосибирск 1999СОДЕРЖАНИЕ 1999 2 ВВЕДЕНИЕ 2 ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 3 ЭКСПЕРТНЫЕ СИСТЕМЫ, ИХ НАЗНАЧЕНИЕ И СТРУКТУРА 4 ЗАДАЧИ ДИАГНОСТИКИ 4 ПРОЦЕСС ПРИОБРЕТЕНИЯ ЗНАНИЙ 5 МАШИНА ВЫВОДА 6 ПОСТАНОВКА ЗАДАЧИ 8 ФОРМУЛИРОВКА В ПОЛЬЗОВАТЕЛЬСКИХ ТЕРМИНАХ 8 ВХОДНЫЕ ДАННЫЕ 9 ВЫХОДНЫЕ ДАННЫЕ 9 СПЕЦИАЛЬНЫЕ ТРЕБОВАНИЯ 10 МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИ 10 МЕТОДЫ И ОПРЕДЕЛЕНИЯ 10 СТРУКТУРЫ ДАННЫХ 11 Структуры данных данного программного средства – 4 таблицы формата Paradox 7.0 (работу с этими таблицами обеспечивает DBE и DBD, которые как раз поставляются в комплект с Borland Delphi с целью «безпроблемной» работы с базами данных практически любого формата). 11 Таблица клиентов 11 Таблица симптомов 12 Таблица соответствий 12 Таблица весов 12 АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ 12 СПЕЦИАЛЬНЫЙ ИНСТРУМЕНТАРИЙ 15 СХЕМА ФУНКЦИОНИРОВАНИЯ ПРОГРАММНОГО СРЕДСТВА 15 ОПИСАНИЕ ПРОГРАММЫ 18 ОТЛАДКА И ТЕСТИРОВАНИЕ ПРОГРАММНОГО СРЕДСТВА 19 РУКОВОДСТВО ПО ЭУСПЛУАТАЦИИ ПРОГРАММНОГО СРЕДСТВА 20 8.1. РУКОВОДСТВО СИСТЕМНОГО ПРОГРАММИСТА 20 ЗАКЛЮЧЕНИЕ 22 ЛИТЕРАТУРА 23 ВВЕДЕНИЕТема проекта – «Разработка подсистемы вывода в диагностической экспертной системе». Данная дипломная работа была выполнена на кафедре систем информатики в лаборатории искусственного интеллекта, Института Систем Информатики Сибирского Отделения Российской Академии Наук. (ИСИ СО РАН). Научный руководитель – Попов Иван Геннадьевич. Работа выполнялась с 1 сентября 1998 года по 30 мая 1999 года. Тип работы – инженерная; является плановой разработкой института. Особенностью данной дипломной работы является возможность ее работы с нечеткими и неточными входными данными. При этом подсистема вывода будет использовать экспертные знания, также допускающие элементы нечеткости и неточности. Работа является коллективной. В мою часть работы входит создание машины вывода диагностической экспертной системы.
Разработка данного дипломного проекта подразумевает выполнение следующих работ: Разработка диагностической экспертной системы
как с клавиатуры, так и из файлов на диске. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИДанная дипломная работа разрабатывалась в лаборатории искусственного интеллекта. Рынок современных диагностических систем не сильно «балует» пользователей новыми поступлениями [1]. Поэтому мы решили написать программу, аналогичную уже имеющимся, выпущенным в 1990-1994 гг, но более современную, с эргономичным многоуровневым пользовательским интерфейсом, под Операционную систему Windows 95/98. Аналогом данной экспертной системы послужила известная в свое время система Di-Gen, обеспечивающая медицинскую диагностику пациентов и техническую диагностику доменных печей. Данная работа выполнялась в среде Borland Delphi 4, объектно-ориентированной среде программирования. ЭКСПЕРТНЫЕ СИСТЕМЫ, ИХ НАЗНАЧЕНИЕ И СТРУКТУРАПо определению Комитета по Экспертным Системам Британского Компьютерного Общества, под экспертной системой понимается « воплощение в ЭВМ компонента опыта эксперта, основанного на знании, в такой форме, что машина может дать интеллектуальный совет или принять интеллектуальное решение относительно обрабатываемой функции». Желательная дополнительная характеристика (которую многие считают главной) - способность системы по требованию объяснить ход своих рассуждений понятным для спрашивающего образом [2]. Предметом теории экспертных систем служат методы и приемы конструирования систем, компетентных в некоторой узкоспециальной области. Эта компетентность состоит из знания конкретной области, понимания задач из этой области и из умения решать некоторые такие задачи. Знания, относящиеся к любой специальности, обычно существуют в двух видах: общедоступные и индивидуальные. Общедоступные знания - это факты, определения и теории, которые обычно изложены в учебниках и справочниках по данной области. Но, как правило, компетентность означает нечто большее, чем владение такими общедоступными сведениями. Специалисты в большинстве случаев обладают ещё и индивидуальными знаниями, которые отсутствуют в опубликованной литературе. Эти личные знания в значительной степени состоят из эмпирических правил - эвристик, которые позволяют экспертам при необходимости выдвигать разумные предположения, находить перспективные подходы к задачам и эффективно работать при зашумленных или неполных данных. Центральной задачей при построении экспертных систем является выявление и воспроизведение таких знаний. В архитектуре экспертной системы можно выделить три основных компонента: база знаний, машина вывода и интерфейс пользователя.
ЗАДАЧИ ДИАГНОСТИКИОдной из типичных задач экспертной системы является задача диагностики [3]. Диагностика - это процесс поиска неисправностей в обследуемой системе (или определение стадии заболевания в живой системе), основанный на интерпретации данных, возможно зашумленных. Нахождение согласованных и корректных интерпретаций является основным требованием в этой задаче. Одно из необходимых условий достижения результата - понимание диагностом структурной организации обследуемой области и механизмов взаимодействия между различными подсистемами. В задачах диагностики необходимо предположительное рассуждение. Во многих диагностических процедурах с успехом используются предположения относительно степени надежности датчиков, т.е. степени надежности вводимой информации. Так же, в задаче диагностики можно столкнуться с ситуацией, которая изменяется во времени по мере того, как происходит развитие болезни (или в связи с предпринимаемым лечением). И наконец данные, поступающие от датчиков, часто оказываются зашумленными. Это существенный момент в задаче диагностики, где рассуждения проводятся на основании результатов измерений. К примеру, задача медицинской диагностики заключается в обнаружении заболеваний на основе интерпретации данных о текущем состоянии больного, которые получаются в результате анализа жалоб пациента, его объективного осмотра, результатов лабораторных обследований и анализов. Среди задач диагностики наиболее сложными являются задачи дифференциальной диагностики. Их сложность определяется тем, что среди множества заболеваний, имеющих общие признаки, надо выбрать наиболее вероятные. Для решения такого типа задач должна эффективно использоваться разрабатываемая оболочка. ПРОЦЕСС ПРИОБРЕТЕНИЯ ЗНАНИЙПриобретение знаний - это процесс передачи и преобразования опыта по решению задач от некоторого источника знаний в программу. Процесс создания диагностической экспертной системы можно разделить на следующие этапы:
В нашем случае эксперт взаимодействует с экспертной системой непосредственно через интеллектуальную редактируемую программу. Т.е. вся работа инженера знаний на этих этапах уже должна быть заложена в программу.
МАШИНА ВЫВОДАМашиной вывода можно назвать набор средств, реализующих тот или иной способ рассуждения, технологию поиска по базе знаний, обработку неопределенности и обработку ошибок. Методы рассуждений. Самые распространенные методы логического вывода - это прямая цепочка рассуждений (прямой вывод) и обратная цепочка рассуждений (обратный вывод). При решении задач диагностики используется обратный вывод. Можно сказать, что обратный вывод белее эффективен, когда пользователь должен выбирать из набора возможных последствий как в случае медицинской или технической диагностики. В разрабатываемой оболочке реализуется механизм смешанного вывода, который позволяет и прямой вывод от фактов к заключениям, и обратный - чтобы подтвердить или опровергнуть гипотезу. Управление достоверностью. Одной из важных особенностей экспертной системы является её способность работать с неполной, неточной, недоопределенной информацией. Неточность в ЭС может возникать следующим образом:
Фактор уверенности предоставляет пользователю возможность указать степень уверенности в достоверности вводимой им информации. Так же фактор уверенности демонстрирует степень уверенности системы в достоверности сделанных ею логических заключений. Нечеткие рассуждения подходят для решения проблем, в которых используются такие неопределенные характеристики, как примерно, возможно, близко к. Нечеткая переменная может одновременно иметь более одного значения, каждое со своим коэффициентом уверенности. Важным свойством для экспертной системы является способность устанавливать порог уверенности. Машина вывода может работать таким образом, что будет рассматривать только те факты и гипотезы, которые имеют фактор достоверности выше установленного пользователем. Пользователь может ускорить процесс вывода, установив высокий порог достоверности и тем самым дать указание Машине вывода рассматривать только факты и гипотезы с высокой степенью достоверности. Так же, следует обратить внимание на ситуацию, когда пользователь в ответ на вопрос отвечает неизвестно. Основной принцип, который реализуется в оболочке, состоит в том, что все проблемные знания описываются экспертом в объектно-ориентированном стиле, а продукционное представление знаний, используемое на более низком уровне, генерируются автоматически и скрыто от эксперта. Эти идеи и ложатся в основу технологических решений при конструировании оболочки.
Характерными особенностями знаний о сложных фрагментах действительности являются их неполнота, неоднозначность, отсутствие точности – свойства, которые существенно затрудняют (а иногда и делают невозможным) поиск адекватного решения задачи [4]. Любую модель надо строить с учетом принципиальной неполноты и принципиальной возможности ошибок и противоречий в написании задачи. Эти и другие так называемые НЕ-факторы отражают то обстоятельство, что в реальном мире существуют в основном объекты, которым присущи все эти свойства или хотя бы одно из них. К настоящему времени наибольшее развитие получил НЕ-фактор, который известен, как недоопределенность конкретных знаний. Недоопределенность связана с неполнотой доступной в данный момент информации о моделируемом фрагменте реальности. Эта неполнота касается в первую очередь значений величин объектов (например, около двух часов – о времени), но может присутствовать и в случае неполноты информации о типах объектов (то ли окружность, то ли эллипс) и о существующих отношениях между объектами (то ли раньше, то ли позже). Мы назовем значение переменной неопределенным, если о нем известно лишь то, что оно равно одному из элементов множества потенциальных значений. Значение считается определенным, если однозначно известен тот элемент множества потенциальных значений, которому оно равно. Типичным состоянием изучаемого объекта целесообразно считать недоопределенность: бесспорный факт принадлежности его значения какому-то нетривиальному подмножеству области определения. При этом потенциальное совпадение с тем или иным элементом этого множества считается равновероятным. Рассмотрим модель, которую будем называть обобщенной вычислительной моделью (ОВМ): M = (X,W,C,R), Где множества X и R имеют такую же семантику, как и в обычных вычислительных моделях, W – множество функций присваивания, а C – множество функций проверки корректности. Функция присваивания определяет способ записи очередного значения в объект xX, а функция проверки корректности осуществляет контроль за правильностью вычисленных значений объекта x. Пусть x – переменная с областью определения X. Обозначим через *X множество всех подмножеств X, без пустого. Элемент d*X, который содержит только одно значение из X, называется определенным. Все остальные элементы называются недоопределенными. Значение *x, соответствующее всему множеству X, будем называть полной неопределенностью. ОВМ, в которой хотя бы один объект представлен недоопределенным типом данных, называется недоопределенной моделью (н-моделью) [5]. Рассмотрим систему из двух линейных уравнений с двумя целочисленными переменными: x + y = 12 2*x = y Для предоставления целых констант данной системы (2 и 12) естественно воспользоваться предопределенным типом integer. Если переменным x и y также сопоставить тип integer, то получим традиционную модель. Найти решение в данном случае можно, только применяя любой из методов решения систем линейных уравнений. Если же для представления переменных x и y воспользоваться недоопределенным типом (например, nint), то система уравнений становится н-моделью. Далее покажем внутреннее представление такой н-модели и алгоритм ее решения. Множество Х содержит все объекты данной н-модели: Х = {x,y:nint; 12,2:integer}. Так как множество Х содержит две переменные и две неизменяющиеся константы, множество функций присваивания (W) и множество функций порверки корректности (С) содержат по два элемента: W = { PRint(x), PRint(y) } PRint – имя функции присваивания. C = { PRDint(x)< PRDint(y) } PRDint – имя функции проверки корректности. Множество отношений (R) для данной системы уравнений содержит два отношения (plus и umn), связывающие между собой переменные типов nint и integer (здесь мы игнорируем дополнительные переменные, которые, возможно, появились бы в результате компиляции исходных уравнений): R = { plus(12,x,y); umn(y,2,x) }. Множество функций интерпретации отношений из R можно представить следующим образом (в комментариях приведены описания функций в обычной записи): Plus: minus 3 #y, 12, *x; (*y:=12-x*) (1) minus 3 #x, 12, *y; (*x:=12-y*) (2) umn: umn 3 #y, x, 2; (*y:=x*2* ) (3) del 3 #x, y, 2; (*x:=y/2* ) (4) Напомним, что арифметические операции реализованы в соответствии с правилами интервальной математики. Технология недоопределенных вычислительных моделей позволяет обрабатывать неточные значения. ПОСТАНОВКА ЗАДАЧИВ задачу данной дипломной работы входит разработка машины вывода диагностической экспертной системы. Особенностью разрабатываемой машины вывода является ее способность работать с неточными и нечеткими входными данными. При этом машина вывода будет использовать экспертные знания, также допускающие элементы нечеткости и неточности. ФОРМУЛИРОВКА В ПОЛЬЗОВАТЕЛЬСКИХ ТЕРМИНАХНеобходимо было разработать систему медицинской диагностики, которая позволяла бы на основе неполных данных ставить диагноз с некоторой точностью, и выдавать, насколько точно она определила болезнь. ВХОДНЫЕ ДАННЫЕВходными данными моей части программы являются:
Иначе говоря, входные данные можно разбить на два больших блока:
Сюда также входит и база данных о пациентах (их «больничные карточки»)
ВЫХОДНЫЕ ДАННЫЕВыходными данными программы является диагноз, построенный на основе наблюдаемых симптомов и базы знаний о болезнях. Этот диагноз выдается на экран в качестве окончательного ответа экспертной системы пользователю. Кроме того, информация об обнаруженной болезни и наблюдаемых симптомах заносится в карточку пациента. В процессе работы система генерирует несколько рабочих версий окончательного диагноза, и в конце происходит «отсеивание» лишних гипотез, которые имеют вес, меньший, чем некоторое значение, заранее заданное системным программистом. Например, в процессе работы сформировалось 5 версий с вероятностями от 67 до 98 %. Порог уверенности, заданный системным программистом – 75%. Тогда система выдаст все версии, вероятности которых больше 75%. Например, их 3. Болезнь 1 – 94% Болезнь 2 – 93% Болезнь 3 – 87% Болезнь 4 – 51% Болезнь 5 – 67% Система «отсеет» остальные болезни, кроме этих трех, и выдаст эти три в порядке убывания их вероятностей: У вас, скорее всего, Болезнь 1. Вероятность – 94% Вероятность Болезни 2 – 93% Вероятность Болезни 3 – 87% Также следует упомянуть, что система ведет регистрацию больных, их болезней, и ведет статистику заболеваний:
СПЕЦИАЛЬНЫЕ ТРЕБОВАНИЯ
МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИМЕТОДЫ И ОПРЕДЕЛЕНИЯБаза знаний – Совокупность трех реляционных баз данных в формате Paradox 7.0:
Вес – Вероятность той или иной болезни в процентах. Недоопределенная спецификация – Набор данных, на основе которого невозможно принять окончательное решение. Фактор уверенности – Фактор уверенности демонстрирует степень уверенности системы в достоверности сделанных ею логических заключений. Порог уверенности – число, заранее определенное пользователем, означающее максимальный вес болезни в данном случае, ниже которого гипотезы просто не рассматриваются. СТРУКТУРЫ ДАННЫХСтруктуры данных данного программного средства – 4 таблицы формата Paradox 7.0 (работу с этими таблицами обеспечивает DBE и DBD, которые как раз поставляются в комплект с Borland Delphi с целью «безпроблемной» работы с базами данных практически любого формата).Таблица клиентов
Что касается пункта 5. (fotokard), то для этого специально был разработан модуль для работы со сканером, чтобы можно было ввести фотокарточку пациента в его медицинскую карту. Таблица Болезней
Таблица симптомов
Таблица соответствий
Все значения таблицы – numeric. Число в пересечении колонок есть «указатель» на ту болезнь, на которую указывает определенный симптом, либо на тот симптом, на который указывает определенная болезнь. Таблица весов
Таблица размером [Кол-во болезней]х[Кол-во симптомов]. Число в пересечении колонок – Вес данного симптома для данной болезни. АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИРабота программы начинается с функции инициализации, которая ответственна за присвоение данным начального значения. После чего управление получает процедура “Главного меню”. Далее, в зависимости от действий пользователя, происходит вызов одной из нижеперечисленных процедур:
В мою часть входила обработка следующих пунктов:
На каждом шаге алгоритма у системы есть откат, т.е. у пользователя есть возможность, если он что-то забыл, вернуться в предыдущее состояние системы, нажав кнопку «Назад». Если же ему захочется все начать сначала, то, нажав кнопку «Отмена», система вернется в первоначальное состояние. На вход системы (данные, введенные пользователем с клавиатуры) изначально поступает неполная информация, вследствие чего система не может однозначно поставить диагноз. Для решения данной проблемы используется следующий алгоритм:
Первоначальный шаг. При входе в систему пользователь видит перед собой список всех симптомов, имеющихся в базе. Напротив выборочных пунктов списка симптомов пользователь выставляет “галочки” (те симптомы, которые он у себя наблюдает). Нажав кнопку “Далее” система переходит к следующему пункту.
После ввода пользователя некоторых первоначальных симптомов, система анализирует, к каким болезням принадлежат данные симптомы. Алгоритм определения первоначального списка болезней:
5.1) Если данная болезнь уже имеется в списке, то переходим к п.6; 5.2) Если элемент таблицы =0, то болезнь в список не включаем;
Каждый симптом может принадлежать сразу нескольким болезням, поэтому в первоначальном списке болезней болезней будет не столько же, сколько симптомов. Следует также учесть, что симптомы есть значимые и незначимые, т.е. вес симптома по отношению к какой-либо болезни либо большой, либо малый. Данный процесс регулируется системой, поэтому никак не зависит от пользователя.
Имея начальный список болезней, система проводит их дифференциацию. Далее система начинает проводить “рассуждения”. Самые распространенные методы логического вывода - это прямая цепочка рассуждений (прямой вывод) и обратная цепочка рассуждений (обратный вывод). В основном, при решении задач диагностики используется обратный вывод. Можно сказать, что обратный вывод более эффективен, когда пользователь должен выбирать из набора возможных последствий как в случае медицинской или технической диагностики. В разрабатываемой системе реализуется механизм смешанного вывода, который позволяет и прямой вывод от фактов к заключениям , и обратный - чтобы подтвердить или опровергнуть гипотезу. В процессе уточнения информации система, задавая пользователю вопросы, проводит «отсеивание» лишних гипотез, имеющих малый вес. Для просчета веса гипотез система открывает данные из файла на диске, а именно таблицу весов. Таблица весов размером [Кол-во болезней] на [Кол-во симптомов] имеет в пересечении клеток число, равное весу данного симптома для данной болезни; порог уверенности заранее задается в настройках.
Если пользователь не смог ответить на некоторые вопросы на этапе первоначального опроса, то система дает рекомендации, как можно собрать эти данные, (сдать анализы, провести ЭКГ) и на основе этого собирает дополнительные данные. Рекомендации система дает только на гипотезы, имеющие большой вес (чтобы подтвердить их весомость, и чтобы пациенту не стоило сдавать лишних анализов).
В процессе предыдущих шагов выявляется несколько версий окончательного результата, которые система распределяет по порядку возрастания вероятности той или иной болезни. Вероятности болезней также считаются по таблице весов. Алгоритм подсчитывания веса:
После подсчета весов всех болезней выбирается болезнь, имеющая максимальный вес, и происходит нормировка весов болезней (чтобы они были в пределах от 1 до 100) Далее система выбирает те болезни, вероятности которых находятся в некоторых рамках, заранее определенных системным программистом (так называемый “порог уверенности”). Значение порога уверенности можно задать в настройках программы. Формула для подсчета веса болезни: ves_b(j) = [tab_ves(ves(i,j))]*k(i) То есть, для конечного подсчета вероятности не применяется умножение веса на коэффициенты, а идет суммирование всех элементов таблицы весов (tab_ves(ves(i,j)) имеющих отношение к болезни. Далее происходит нормировка всех конечных вероятностей с целью “укладывания” их в промежуток от 1..100. (Чтобы окончательный ответ измерялся в процентах). k(i) – коэффициент присутствия симптома (равен либо «0», либо «1»). Пример:
Например, в процессе работы были выбраны симптомы 2,4 и 6. Система будет суммировать вес: Ves_b("склероз")=10*0+106*1+64*0+55*1+20*0+43*1=204. Далее:
J=-1; // отрицательное значение для начала. For i=1 to 15 do ( if j>max(ves_b(i)) // если j больше максимального значения, j=max(ves_b(i)); // то j=max.
Система выдает те болезни, которые были выбраны в предыдущем пункте в порядке процентного убывания, на экран. Пример: У вас, скорее всего, Склероз. Вероятность – 94% Вероятность физического повреждения мозга – 93% Вероятность простой потери памяти – 87% В данном случае, порог уверенности, установленный системный программистом, составляет 92%, поэтому все болезни, имеющие веса, не превышающие планки 92%, просто отсеиваются. СПЕЦИАЛЬНЫЙ ИНСТРУМЕНТАРИЙДля разработки данной программы была выбрана программная среда Borland Delphi 4.0. Для создания баз данных была использована разработка фирмы Borland - DBD (Database Desktop).Среда Borland Delphi была выбрана не случайным образом:Было решено, что разрабатываемая система, в отличие от ее предшественника, системы Di-Gen, будет функционировать в операционных системах Windows 95/98 или NT, имеющих наиболее широкое распространение.
СХЕМА ФУНКЦИОНИРОВАНИЯ ПРОГРАММНОГО СРЕДСТВА5.1. МОДЕЛЬ ИНТЕРФЕЙСА
5.2. СВЯЗЬ КОМПОНЕНТ ВО ВРЕМЯ РЕШЕНИЯ ЗАДАЧИ (ОБЩАЯ СХЕМА)
ОПИСАНИЕ ПРОГРАММЫЕсли процедуре, либо функции в качестве параметра передается Sender типа TObject, то он не является входным параметром функции, так как он является стандартным параметром, сгенерированным языком Delphi. Входные же параметры большей частью берутся из глобальных переменных, либо из полей баз данных. Function Belongs(Value : Integer) : Boolean; Входные данные: Симптом; Поле базы болезней Выходные данные: Существует или нет данный симптом у данной болезни. Procedure Find_Pred_Bol; Входные данные: База симптомов; База болезней Выходные данные: Предварительный список болезней Procedure TForm2.BitBtn1Click(Sender: TObject); Входные данные: Номер предыдущего процесса; Состояние полей входного процесса Выходные данные: Номер следующего процесса Procedure TForm2.BitBtn2Click(Sender: TObject); Входные данные: Номер текущего процесса Выходные данные: Номер следующего процесса Procedure TForm2.FormActivate(Sender: TObject); Входные данные: Идентификатор первого запуска Выходные данные: Инициализация некоторых параметров Procedure TForm2.N12Click(Sender: TObject); Входные данные: - Выходные данные: Сброс ЭС и приведение ее в «стартовое положение» Procedure TForm2.Timer1Timer(Sender: TObject); Входные данные: Заполненные поля форм Выходные данные: Разрешение/запрещение на выполнение следующего процесса ОТЛАДКА И ТЕСТИРОВАНИЕ ПРОГРАММНОГО СРЕДСТВАДля тестирования программы были использованы стандартные встроенные в программную среду Borland Delphi, средства отладки. Также в экспериментальных целях было произведено несколько пробных запусков на базе знаний, содержащих 7 болезней и 15 симптомов. Во всех случаях система корректно ставила диагноз. В данный момент система находится на стадии комплексного тестирования. Окончательного варианта на других базах знаний не существует. Для проверки корректности вычисления конечного результата был произведен следующий тест: Было специально отобрано две болезни, имеющие очень близкие симптомы [6]; с целью проверки корректности системы был произведен запуск системы, на вход которой были поданы именно эти схожие симптомы. Система после сбора информации о болезнях корректно выявила заранее намеченную болезнь (В конечном итоге вероятности этих болезней были очень близки по значению). Пример (Выдержка из книги [7]): Корь – острое вирусное заболевание. Начинается остро, с подъема температуры до 39-40 С, головной боли, недомогания, насморка, кашля, слезотечения, светобоязни. На 2-3 день на слизистой оболочке щек, десен появляются пятна Филатова – Коплика, напоминающие рассыпанную манную крупу. Затем появляется полиморфная сыпь, проходящая период пигментации и отрубевидного шелушения. Лечение в большинстве случаев проводят в домашних условиях. Госпитализации подлежат дети с тяжелыми формами болезни, с осложнениями, по эпидемиологическим и бытовым показаниям (из общежитий, интернатов). При выраженном конъюнктивите глаза промывают раствором борной кислоты, закапывают альбуцид. Больному необходим постельный режим на протяжении всего лихорадочного периода, удобное положение в постели, чтобы свет не падал в глаза. В помещении проводят только влажную уборку, часто проветривают комнату. Регулярное умывание, чистота полости рта, глаз, носа – необходимые условия ухода за больным корью. Показано обильно питье: соки, чай с лимоном, кефир и т.п. В данном случае все симптомы перечислены налицо. Весомыми симптомами (имеющими относительно большой вес) в данном случае являются: светобоязнь, появление пятен Филатова - Коплика, переходящих в полиморфную сыпь. Остальные симптомы не являются особо весомыми (подъем температуры, недомогание, насморк…), так как их наличие также возможно и в других болезнях, но они вносят свой вклад в определение итогового веса болезни. Здесь также сказано и про лечение (профилактику), информация о котором находится в отдельном файле на диске. РУКОВОДСТВО ПО ЭУСПЛУАТАЦИИ ПРОГРАММНОГО СРЕДСТВА8.1. РУКОВОДСТВО СИСТЕМНОГО ПРОГРАММИСТАДля корректной работы системы ее необходимо правильно установить (и конфигурировать). Установка производится в несколько этапов:
необходимо отметить галочкой пункт установки DBE.
Первая строка – полный путь до файлов баз данных. По умолчанию – диск:\каталог\BASE. Вторая строка – полный путь до файлов картинок (фотографий). По умолчанию – диск:\каталог\image Третья строка – полный путь до файлов текстов (рекомендаций по излечению болезней и сбору дополнительной информации). По умолчанию – диск:\каталог\TXT.
После этого перед вами появится основная форма:
Нажатие кнопки можно осуществить следующими способами:
Вызов соответствующего пункта меню:
Вызов всплывающего меню:
ЗАКЛЮЧЕНИЕВ рамках поставленной задачи требовалось создать систему медицинской диагностики (с возможностью дальнейшего расширения области ее знаний). Особенностью системы является возможность ее работы с нечеткими входными данными. Знания эксперта также могут допускать элементы нечеткости и недоопределенности. Была выполнена следующая работа:
Поставленная задача была выполнена. В результате была создана диагностическая система с машиной вывода. В данный момент она находится в стадии комплексного тестирования. Результаты предварительного тестирования выявили несколько недостатков, и в настоящий момент идет работа по их устранению. В заключении я хочу выразить благодарность своему научному руководителю за умелое руководство м.н.с. ИСИ СО РАН Попову Ивану Геннадьевичу и заведующему кафедрой искусственного интеллекта, с.н.с. к.т.н. ИСИ СО РАН Загорулько Юрию Алексеевичу. ЛИТЕРАТУРА
|