Реферат: Базы знаний
Название: Базы знаний Раздел: Рефераты по философии Тип: реферат |
Содержание 1. Введение 4 2. Различные типы знаний и их представления 5 2.1. Различные типы знаний. 5 2.2. Различные представления знаний в существующих системах. 7 2.3. Способы использования знаний и доступ к ним. 9 2.4. Преимущества и недостатки продукционных систем 10 3. Метазнание 12 3.1. Метазнание объектов окружающего мира 12 3.2. Метазнание стратегий 13 1. Введение Задание на курсовую работу по дисциплине "Базы данных" Студент группы ОИН 10913 Зубко Д.В. Направление: "Информатика и ВТ", № контракта 19000010602071 Тема: Базы знаний Задание выдано:______________ 2. Различные типы знаний и их представления В настоящее время целью исследований в области ИИ является создание таких систем, которые, с одной стороны, могут использовать большое количество знаний, передаваемых им специалистами, а с другой - способны вступать в диалог и объяснять свой собственные выводы. Это предполагает наличие эффективного управления большой по объему и хорошо структурированной базой знаний, строгое разграничение между различными уровнями знаний, наличие множества удобных представлений для правил, схем предикатов или прототипов и четко определенный процесс обмена информацией между различными источниками. Необходимо, чтобы система знала, что она знает. Если попытаться провести аналогию с людьми, то подобное метазнание означает постоянное использование в течение жизни информации о каждом прожитом дне. Если, например, вы забыли имя приятеля, встреченного на улице, то ваше метазнание состоит в том, что либо вы его имя знали, но забыли, либо этого имени никогда не знали. Впрочем, мы постоянно используем важные эвристические правила, основанные на подобном метазнаний, такие, как "если бы это была правда, то я бы это знал". Они зависят от двух важных параметров: значимости имеющего к ним отношения факта и степени нашей собственной компетентности в данной области. В действительности каждое человеческое знание сразу же требует метазнания, связанного с тем местом, которое мы отводим данному знанию в ряду другой информации, как мы к нему относимся, для каких целей оно нам полезно, к какому семейству принадлежит. Все эти моменты рассматриваются в следующих разделах, посвященных описанию реальных информационных систем. 2.1 Различные типы знаний Выделим восемь основных типов знаний по следующим признакам. 1) Базовые элементы, объекты реального мира. Они связаны с непосредственным восприятием, не требует обсуждения, и добавляются к нашей базе фактов в том виде, в котором они получены. 2) Утверждения и определения.
Они основаны на базовых элементах 3) Концепции. Они представляют собой перегруппировки или обобщения базовых объектов. Для построения каждой концепции используются свои приемы. Например, в системах МЕСНО (Bundy, 1979) или AM (Lenat, 1977) они построены на основе примеров, контр примеров, частных случаев, более общих или аналогичных концепций. 4) Отношения. Они выражают как элементарные свойства базовых элементов, так и отношения между концепциями. Кроме того, к свойствам отношений относятся их большее или меньшее правдоподобие, большая или меньшая связь с данной ситуацией. Еще раз отметим, что представление знаний в экспертных системах близко к моделям, используемым в базе данных. Таким путем построена реляционная (обобщенная) модель базы данных в системах OPS, PROLOG, SNARK и TANGO. Пара понятий "свойство - значение" (relationship - entity) хорошо известна в семантических сетях; фреймы и скрипты являются не чем иным, как наиболее простыми бинарными отношениями. Некоторые экспертные системы (INTERNIST, BAOBAB, SPHINX) в качестве базы факторов используют уже базы существующих данных. 5) Теоремы и правила перезаписи.
Они являются частным случаем 6) Алгоритмы решений. Они необходимы для выполнения определенных задач. Во всех случаях они связанны со знанием особого типа, поскольку определяемая ими последовательность действий оказывается оформленной в блок в строго необходимом порядке в отличие от других типов знания, где элементы информации могут появляться и располагаться без связи друг с другом. Очевидно что очень трудно работать с длинными процедурами, состоящими из большого числа различных действий. .Использование чистых алгоритмов ограниченно очень частными случаями, большая часть которых имеет дело с обработкой числовой информации. Человек же должен уметь работать со многими другими типами информации и оказывается, что ЭВМ в отличие от простого калькулятора может помочь человеку в подобных неалгоритмических ситуациях. 7) Стратегии и эвристика.
Этот тип представляет собой врожденные Появление экспертных систем связанно с необходимостью принятия в расчет именно этого фундаментального типа человеческих знаний. 8) Метазнание.
Без сомнения оно присутствует на многих уровнях и 2.2. Различные представления знаний в существующих системах. Приведем краткий список наиболее распространенных в настоящее время методов. Фундаментальное различие между ними состоит в простоте модификации знания. В таблице ниже они приведены в порядке от наиболее процедурного (наиболее застывшего, структурированного) до наиболее декларативного (наиболее открытого, свободного, неупорядоченного) Такая классификация является несколько грубой, но правильно: отражает идею. Напомним, что конечные автоматы, программы, исчисление предикатов и системы с продукционными правилами с теоретической точки зрения эквивалентны друг другу, поскольку их в принципе можно свести к универсальной машине Тьюринга, хотя их "эксплуатационные характеристики" сильно различаются. Такие формальные понятия, как фреймы; скрипты, семантические сети, возникли из реальных потребностей искусственного интеллекта и приносят большую помощь в понимании языка. Фреймы предложены Минским в 1975 г. и представляют собой сложные структуры данных, описывающих какую-либо типичную ситуацию, например ожидание в аэропорту или участие в семейном обеде. Фрейм состоит из позиций для размещения объектов, характеризующих данную ситуацию. Позиция может быть передана другому фрейму. Кроме того, он содержит информацию о выполняемых действиях, о том, как следует поступать в типичных и нетипичных случаях, о влиянии соседних фреймов. Скрипт или схема представляет собой описание стереотипного сценария действий с участием определенных объектов. Скрипты связаны с текущей культурой и необходимым для понимания таких предложений, как "Я вошел в ресторан, официантка принесла мне меню". Они могут вызывать другие скрипты и обладают большими, чем фреймы, возможностями для описания динамических аспектов знания. Семантические сети - это графы, которые часто представляют собой объединение двух предыдущих понятий и объектом описания которых являются элементы окружающего мира и связи между ними. Они имеют много общего с реляционными моделями баз данных. Изображения и графы эффективно используются для доказательства теорем. Они оказывают большую помощь в проверке отсутствия зацикливания этапов, в полном и эффективном хранении задачи в памяти, в организации ввода новых элементов. 2.3. Способы использования знаний и доступ к ним. Имеются четыре способа использования простой информации в форме pÉq. Примером этого может служить "каждый человек ошибается". Самый непосредственный способ состоит в прямом использовании его смысла в формулировках типа: "Нечто ошибается, и я могу доказать, что это нечто - человек". Второй способ, использующий метазнание и обратный ход мыслей, состоит в следующем: "Если я хочу доказать, что нечто ошибается, то возможная подцель состоит в том, чтобы показать, что это нечто - человек". Оба первых способа используют модус поненс, два следующих используют отрицание предложения q и модус толенс: а) "Если нечто не ошибается, оно не может быть человеком". Б) "Если я хочу доказать, что нечто не является человеком, то я могу попытаться показать, что оно не ошибается". Отметим, что принцип решения и, в частности, использующий его язык С практической точки зрения использование информации зависит от параметров, которые характеризуют ее правдоподобие. Каждая система • Какая часть утверждения А является истиной? • С какой степенью уверенности эксперт согласен с заключением? • Какова средняя вероятность достижения цели с использованием А? • В какой мере следует оказать предпочтение А перед другими? Некоторые системы, основанные на продукционных правилах, используют процессы приближенного вывода, учитывающие эти обстоятельства. Системы, применяющие продукционные правила, описаны выше. В следующем разделе показано возможное различие между этими системами и подходом к решению тех же проблем с помощью логики первого порядка, отмечены также преимущества и недостатки подобного моделирования знаний. 2.4. Преимущества и недостатки продукционных систем Начнем с недостатков. Выделим из них три главных, с которыми связаны определенные ограничения, лежащие в основе используемого формализма. Они относятся к концепции, формулировке и использованию правил. 1. Трудность составления продукционного правила, соответствующего элементу знания. Нужно, чтобы рассматриваемая область 2. Трудность записи правила. Единый формат записи ЕСЛИТО- К преимуществам относится следующее. 1. Модульность. Системы устроены так, чтакаждая единица информации. может быть удалена, изменена или добавлена независимо от всех остальных. Знания вводятся неупорядоченно, как в словаре или энциклопедии. Практика показывает, что это является естественным способом пополнения своих знаний для эксперта. Как ни странно, многочисленные американские авторы (Дэвис, Ньюэлл, Куинлан, Стэфик) нарушают это правило, т. е. проблема реорганизации решается у них довольно плохо. 2. Модифицируемость. Если добавляется или модифицируется какое-либо правило, то все, что было уже сделано ранее, остается в силе и к новому правилу не относится. Таким образом, каждое изменение обладает свойством аддитивности и локальности. В отличие от этого в процедурных программах подобные взаимодействия ограниченны, любая модификация является ерундой и может привести к непредсказуемым последствиям. 3. Доступность чтения. • Для нас это преимущество, безусловно, имеет место. Как уже говорилось выше, наше собственное знание является модульным, поэтому продукционные системы нам кажутся более близкими, более легкими для чтения. Этим преимуществом нельзя пренебрегать, поскольку подобные системы в первую очередь предназначены для врачей, биологов, архитекторов и т. д. Во многих областях реально существуют добавляемые знания и соответствующие базы правил. (Например, автоматизированные экспертные обучающие системы.) • Для машины. Более простой проверке поддается база знаний, представленная в форме правил, а не в форме процедур. Противоречия или избыточность в действительности легко определяется с помощью синтаксической обработки: АÙВ®С и АÙВ®ùС одновременно невозможны; из DÙEÙF®G следует EÙF®G с помощью "подпосылки"; таким образом, первое правило является лишним. Может быть также обнаружена семантическая несогласованность: АÙВ®С неприемлемо, если по определению и из свойств А и В с необходимостью А®ùВ. 4. Способность к самообъяснению. Это свойство связано одновременно и с правилами, и с их структурами внешнего управления. Система легко прослеживает цепочку правил, которую она использовала для получения вы Однородное представление знания, определяемое установленным форма 5. Эффективность. Практика доказала гибкость и компетентность таких Их структура управления позволяет принимать в расчет многочисленные параметры, характеризующие ситуацию. Причина эффективности продукционных правил заключается в том, что эти правила учитывают конкретные данные в каждом случае. 3. Метазнание Метазнание представляет собой любое знание о знании. Оно является фундаментальным понятием для систем, которые не только используют свою базу знаний такой, как она есть, но и умеют на ее основе делать выводы, структурировать ее, абстрагировать, обобщать, а также решать, в каких случаях она может быть полезна. Ввод знаний в систему является задачей не только специалистов в данной области но и самой системы, которая должна управлять этим процессом. 3.1. Метазнание объектов окружающего мира Решение проблем, охватывающих большие объемы знаний, требует умения обращаться с очень сложными и весьма различными типами данных, как по содержанию, так и по взаимосвязи с другими элементами системы. Требуемая информация должна не только присутствовать в программных комментариях и в мыслях разработчика, но и быть доступной самой системе. Таким образом, с каждым элементарным объектом может быть связано смысловое значение — концепт. Например, в системах МЕСНО и MYCIN каждый из концептов содержит следующую информацию: а) описательную часть, которая уточняет характеристики и структуру данных; б) указатель на все известные примеры концепта; в) связи с другими концептами; г) указатель в иерархии схем на группу концептов того же семейства. Когда формулируется новое правило, которое содержит слово или группу слов, неизвестных системе, она их анализирует с помощью имеющихся концептов, используя контекст и последовательность слов правила. Более того, если некоторые свойства известны из других примеров того же концепта, то система в состоянии запросить у пользователя уточнения этого свойства для данного случая. При необходимости она также обнаруживает нарушения связи между концептами. Подобные системы имеют возможность фиксировать все концепты одного и того же иерархического уровня, изменение, внесенное экспертом в, один из них, а также оценивать важность изменений, внесенных в базу данных, если в определенную структуру добавляется новый пример. Кроме того, продукционные правила могут характеризоваться моделями правил. Эти модели создаются и управляются системой и учитывают периодичность использования правил. Они занимаются проверкой соответствия между новым правилом и базой, кроме того, именно они указывают эксперту на главные тенденции множества правил даже в том случае, когда самих правил эксперт не знает. Именно они обогащаются с каждым новым примером по мере роста множества правил. В системе МЕСНО, например, сами формулировки задач связаны с формой метазнания. Система постоянно пытается распознать в формулировке стандартную ситуацию. Когда ей это удается, она дополняет множество фактов всеми физическими гипотезами, справедливыми для данного случая. 3.2. Метазнание стратегий В продукционных системах стратегии также представлены в форме метаправил, поскольку они затрагивают сами правила. Они являются изолированными и доступными для системы. Эвристические законы управления поиском решения используют эти метаправила в качественном и декларативном виде, вместо того чтобы использовать количественные оценки. С применением числовых оценочных функций связан риск ошибки: они плохо читаемы, отражаемый ими частичный порядок приводит с сложным вычислениям, любая модификация приводит к возможности появления ошибки. Стратегии, заданные в форме метаправил, являются более четкими и определенными. Выводы метаправил указывают на действия, которые необходимо предпринять в рассматриваемой ситуации. Таким образом они реализуют полезный потенциал, заключенный в множестве правил, и дают двойной эффект: 1) исключают определенные правила, не подходящие к данной ситуации, и тем самым уменьшают дерево поиска; 2) осуществляют частичную классификацию других правил, частично Конечно же, можно и дальше увеличивать число уровней знания, строя По этой причине система CRYSALIS (Engelmore, 1979) включает три отдельных уровня правил. Она предназначена для анализа протеинов, и размеры ее пространства поиска очень важны с комбинаторной точки зрения. Классический подход в данном случае неприменим. Правила сначала группируются в подмножества (неразобщенные). Каждое подмножество предназначено для определенной обработки и используется при выполнении соответствующих условий. Соответствие между конечными классами и подмножествами правил устанавливается с помощью правил заданий, которые составляют второй уровень знаний. Эти правила определяют, как следует выполнить данное задание наилучшим образом. Наконец, третий уровень относится к мета-метаправилам, которые определяют подцели и выражают их в зависимости от правил задания. В примере, приведенном ниже, показан порядок выполнения системой одного из правил задания, в посылках которого содержится задание ПРОВЕСТИ-МЕЖДУ-ТОЧКАМИ , а также указывается, какому правилу должно быть отдано предпочтение при выполнении задания: ЕСЛИ два гипотетических элемента протеина аи b уже размещены с коэффициентом правдоподобия для каждого из них не менее 0,4 И ЕСЛИ число остаточных элементов в последовательности ab не более 5 ТО использовать правила, предназначенные для задания ПРОВЕСТИ-МЕЖДУ-ТОЧКАМИ Такой способ группировки правил обладает преимуществами и недостатками. Преимущество заключается в том, что управление осуществляется в самом правиле, каждое правило содержит собственные соображения по применению (см. систему AM Лената (1977)). Такая же руководящая идея может быть легко обнаружена и в семействе правил. Недостаток заключается в том, что посылки правил могут оказаться очень громоздкими. Однако существует и альтернативный путь решения этой проблемы, важной с точки зрения эффективности и ясности систем. Он состоит в разрешении все более и более сложных структур посылок в правилах. Эти вопросы затрагиваются при рассмотрении внутреннего представления наборов правил. Работа Виленски (1981) «Метапланирование» посвящена управлению планами действий, независимо от области применения. Он предложил мета-стратегии для разрешения конфликтов между планами, а также рассматривает рекуррентные и конкурентные планы. Одно и то же знание представлено в декларативной форме в двух различных программах РАМ и PANDORA. Одна из них составляет планы для решения задач, другая должна его понять и составить планы для участвующих в действии объектов. Заключение Итак, системы, использующие декларативные базы данных, а также продукционные правила, отношения, прототипы, схемы и семантические сети для представления и использования содержащихся в них знаний, открывают действительно новый подход к программированию, который заключается в возможности передачи от человека к программе наиболее простым образом знаний неупорядоченной структуры в. произвольных областях. Взаимодействие с экспертными системами происходит на декларативном языке, который по сути предназначен для выражения знаний. Подобный подход представляется совершенно необходимым в области искусственного интеллекта, и на этой основе уже созданы эффективные системы. Крайняя простота представления знаний не ставит ограничений перед программистом или специалистом, скорее наоборот, она требует от нас мыслить наиболее естественным образом. Среди многих преимуществ подобного представления знаний, как мы рассмотрели в разд. 1 и 2, находится и обсуждаемое в современных работах одновременное решение задач и понимание естественного языка. Кроме того, экспертные системы предоставляют в наше распоряжение специализированные базы знаний: система PROSPECTOR охватывает знания в области геологии, MYCIN используется для обучения в медицине, а PECOS оказывает помощь в программировании. Наконец, при изучении этих систем становится очевидным, что существенной особенностью нашего интеллекта является способность управлять большим объемом элементарных составляющих информации. Поэтому одним из предметов исследований в области искусственного интеллекта еще долгое время будут три фундаментальные проблемы, уже встречавшиеся при рассмотрении продукционных систем. Они имеют отношение к примитивным действиям, связанным с обработкой любой ин формации: сформулировать — запомнить — использовать • Сформулировать Мы постоянно оказываемся в новых ситуациях. Приходящий к нам опыт заключается прежде всего в способности абстрагироваться от этих ситуаций и описать их с помощью общих представлений, которые могут быть элементами обычного языка. Однако во многих областях этого недостаточно, t так как обычно имеется много неточностей или делается слишком много ссылок на обстоятельства, не связанные с данной конкретной ситуацией. Каждый специалист постоянно совершенствуется в своей области и вырабатывает собственный жаргон. В некоторых книгах часто встречаются советы описывать ситуацию и предпринимаемые действия с очень высокой степенью детализации, однако в этом случае трудно достигнуть нужного эффекта обобщения. Становится сложно использовать всю накопленную информацию. Автоматический поиск концептов, полезных в примитивных ситуациях, безусловно, возможен (как это возможно и для одаренных личностей), однако, с нашей точки зрения, в области искусственного интеллекта в ближайшем будущем этого ожидать не следует. • Запомнить Запоминание информации технологически ограничено и связано прежде всего с эффективностью используемой информационной системы. Если для удобства работы требуется, чтобы элементы знания вводились в продукционные системы независимым образом, как это делается в словарях, то храниться они должны в упорядоченном виде. Правила, сгруппированные в древовидные структуры, представляют собой сеть, узлы которой являются моделями, содержащими описание правил. Кроме того, необходимо, чтобы система умела инвертировать правила, т. е. умела определять, в каких ситуациях данное правило окажется полезным. Инверсия — непростая операция, связанная с обобщением, и с ее помощью осуществляется узнавание концептов, кратких дескрипторов всех возможных ситуаций в процессе обработки информации. Для того чтобы уменьшить издержки, связанные с инверсией, иногда допускается излишний расход памяти. Ясно, что в интеллектуальных, эффективно работающих системах одна и та же информация может быть представлена в нескольких различных форматах. • Использовать При доступе к информации возникают проблемы распознавания форм, которые использовались на предыдущем этапе для образования древовидных структур, прямых и инверсных элементарных правил. Управление поиском идет с помощью метаправил и в более общем виде с помощью моделей знаний высоких уровней, которые позволяют проводить распознавание в зависимости от стратегии, связанной с контекстом, и задерживать выбор на возможно более долгое время. Многие экспертные системы, основанные на продукционных правилах, в Таким образом, экспертные системы предлагают качественно новьй подход к программированию. Из двух главных управляющих структур — проверки и цикла — они оставляют только первую, которая позволяет довольно легко формулировать элементарные факты для интерпретатора, а также повторять циклы наполнения проверок и обработку. Таким образом устраняются два неизбежных недостатка классического программирования: последовательный порядок выполнения операций и приказной характер элементарных инструкций. Вместо инструкций — неупорядоченные отдельные данные, порядок использования которых заранее нельзя предвидеть. Но в еще большей степени экспертные системы позволяют обойтись без всех средств произвольных языков программирования. Действительно, пользователь, эксперт по мере потребностей определяют собственные концепты, специальную терминологию, выбирая подходящий для себя уровень детализации, пригодный для решения поставленных задач. В отличие от этого и к большому неудобству исследователей в области искусственного интеллекта современные языки программирования являются языками слишком низкого уровня. Простое действие, элементарный факт чаще всего оказываются растворенными в большом числе инструкций, и каждая их модификация оказывается трудоемкой и опасной. Таким образом, основной целью исследователей в области искусственного интеллекта является создание форм представления и интерпретации знаний типа экспертных систем, которые, можно назвать языками будущего. Им присущи абсолютная модульность, четкость, полное разделение между данными и управлением, большие возможности по обработке информации, эффективное взаимодействие между человеком и программой, возможность составления программного обеспечения очень больших объемов, имеющего не обязательно алгоритмическую природу. Для того чтобы подобные системы были полезны и за пределами разработавших их лабораторий, осталось выполнить определенный объем работ. В частности, необходимо решить две проблемы. Во-первых, исследовать формальные законы языков, на которых выражаются правила и метаправила, их синтаксис и семантику, типы логических связей, основные примитивы. Необходимо выполнить работу, аналогичную той, которая уже проделана для классических языков программирования, но с учетом интерпретаторов и современных ЭВМ. Во-вторых, вывести работы в области искусственного интеллекта за пределы университетских лабораторий, в частности для экспертных систем разработку эффективных интерпретаторов и механизмов вывода, которые должны найти новых пользователей, как это было при разработке компиляторов. Экспертные системы доказали возможность совершенно нового подхода к развитию информатики. Он заключается в формализации нашего знания с помощью декларативных независимых понятий, в организации четко определенных структур, таких, как продукционные правила, фреймы,скрипты и семантические сети, с помощью которых можно получить изящное решение поставленных задач. Литература 1. Лорьер, Жан-Луи. Системы искусственного интеллекта - М.: 1991; 2. К. Нейлор. Как построить свою экспертную систему. - М.: Энерго- 3. Глушков В.М. Основы безбумажной информатики – М.: Наука, 1982 4. Каймин В.А. Информатика и дистанционное образование – М.: 1998 5. Каймин В.А. Информатика: Учебник-2е изд., переработанное и дополненное – М.: ИНФРА-М, 2002. |