Методы приобретения знаний

Введение.

Инженерия знаний тАУ это область информационной технологий, цель которой тАУ накапливать и применять знания, не как объект обработки их человеком, но как объект для обработки их на компьютере. Для этого необходимо проанализировать знания  и особенности их обработки человеком и компьютером, а также разработать их машинное представление. К сожалению точного и неоспоримого определения, что собой представляют знания, до сих пор не дано. Но тем не менее цель инженерии знаний тАУ обеспечить использование знаний в компьютерных системах на более высоком уровне, чем до сих пор тАУ актуальна. Но следует заметить, что возможность использования знаний осуществима только тогда, когда эти знания существуют, что вполне объяснимо. Технология накопления и суммирования знаний идет бок о бок с технологией использования знаний, они взаимно дополняют друг друга и ведут к созданию одной технологии, технологии обработки знаний.

В данной работе я постарался описать методы решения одной из проблем данного комплекса тАУ это проблемы приобретения знаний, или говоря другими словами тАУ обучения.

Методы приобретения знаний.

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее системаВнтизации. При этом в зависимости от способности сиВнстемы обучения к логическим выводам возможны различные формы приобретения знаний, а также разВнличные формы получаемой информации. Форма предВнставления знаний для их использования определяется внутри системы, поэтому форма информации, которую она может принимать, зависит от того, какие споВнсобности имеет система для формализации информаВнции до уровня знаний. Если обучающаяся система соВнвсем лишена такой способности, то человек должен заранее подготовить все, вплоть до формализации информации, т. е. чем выше способности машины к логическим выводам, тем меньше нагрузка на чеВнловека.

Функции, необходимые обучающейся системе для приобретения знаний, различаются в зависимости от конфигурации системы. В дальнейшем при рассмотВнрении систем инженерии знаний предполагается, что Существует система с конфигурацией, показанной на рис, 1.1, которая включает базу знаний и механизм логических выводов, использующий эти знания при решении задач. Если база знаний пополняется знаВнниями о стандартной форме их представления, то этими знаниями также можно воспользоваться. СлеВндовательно, от функций обучения требуется преобраВнзование полученной извне информации в знания и пополнение ими базы знаний.

Рис.1 Базовая структура систем обработки знаний

Можно предложить следующую классификацию систем приобретения знаний, которая будет опираться на способность системы к восприятию знаний в разных форматах, качественно различающихся между собой и способностью к формализации (рис 2).

Рис 2.Классификация методов приобретения знаний.

Обучение без выводов.

Категорию А можно назвать обучением без выводов или механическим запоминанием, это простой процесс получения информации, при котором необязаВнтельны функции выводов, а полученная информация в виде программ или данных используется для решеВнния задач в неизменном виде. Другими словами, это способ получения информации, характерный для суВнществующих компьютеров.

Категория БтАФэто получение информации извне, представленной в форме знаний, т. е. В форме, котоВнрую можно использовать для выводов. Обучающейся Системе необходимо иметь функцию преобразования входной информации в формат, удобный для дальВннейшего использования и включения в базу знании.

Приобретение знаний на этом этапе происходит в наиболее простой форме: это знания, предварительно подготовленные человеком во внутреннем формате, какими являются большинство специальных знании, изначально заданных в экспертных системах. В слуВнчае прикладных систем инженерии знаний необходиВнмо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную обВнласть, так и инженерию знаний. Таких посредников называют инженерами по знаниям. В общем случае для замены функции посредника можно использовать и специальные подпрограммы. Т.е. необходимо иметь функции выводов достаточно высокого уровня, но можно ограничиться и выводами на сравнительно низком уровне, а остальное доверить человеку тАФ в этом и состоит приобретение знаний в диалоге. ПриВнмером служит хорошо известная система TEIRESIAS. Это система-консультант в области медицины, разраВнботанная на базе системы MYCIN. Специалисты в проблемной  области  являются  преподавателями обучающейся системы, а ученик тАФ система инженерии знаний тАФ изучает ответы на поставленные задачи и корректирует те правила в базе знаний, которые раВннее приводили к ошибкам. Для подготовки знаний в экспертной системе необходимы вспомогательные средства типа редактора знаний, причем в процессе приобретения знаний в диалоге не только редактируются отдельные правила и факты, но и восполВнняются недостатки существующих правил, т. е. ведется редактирование базы знаний.

Если знания заданы во внешнем формате, например на естественном языке, то следует преобразовать их во внутренний формат. Для этого необходимо поВннимать внешнее представление, т. е. естественный язык, графические данные и т. п. Фактически приобретение знаний и их понимание тесно связаны. ПробВнлема понимания сводится не только к преобразованию структуры предложений тАФ необходимо получить форВнмат, удобный для применения.

Аналогичная   проблема тАФ преобразование   во внутренний формат советов, подсказок по решению задач, что называется ВлоперационализациейВ» знаний В этом заключается центральная проблема искусВнственного интеллекта; она, в частности, изучает преВнобразование советов, подсказок, представленных в терминах проблемной области, в процедуры. НаприВнмер, система UNDERSTAND выполняет операционализацию представления задачи о ханойской башне  на английском языке путем построения соответствующих состояний и операций, приводящих к этим состоя* киям.

Приобретение знаний на метауровне

Выше было рассмотрено обучение на объектном уровне, а еще более сложная проблема - приобреВнтение знаний на метауровне, т. е. знаний, основой которых является информация по управлению решеВннием задач с использованием знаний на объектном уровне. Для знаний на метауровне пока не установВнлены ни формы представления и использования, ни связь со знаниями на объектном уровне, ни другая техника их систематизации. Поскольку не определена форма их представления с точки зрения исВнпользования, то трудно говорить о приобретении знаний на метауровне. Тем не менее с этой проблеВнмой связаны многие надежды в инженерии знаний,

Приобретение знаний из примеров

Метод приобретение знаний из примеров отличается от предыдущего метода, тем , что здесь выполняется сбор отдельных фактов, их преобразование и обобщение, а только затем они будут использованы в качестве знаний. И соответственно от уровня сложности системы вывода в системе будут возникать разные по степени общности  и сложности знания. Необходимо также упомянуть о том, что этот метод приобретения знаний почти не нашёл практического применения, это может быть связано с тем, что входная информация представляет собой не систематизированный набор данных и для их обработки требуется наличие в системе обширных знаний по конкретной области.

По сравнению с предыдущим методом приобретения знаний, этот метод имеет большую степень свободы и соответственно необходимо описать общие положения этого принципа.

1. Языки представления. Обучение по примерам тАФ это процесс сбора отдельных фактов, их обобщение и систематизация, поэтому необходим унифицированВнный язык представления примеров и общих правил. Эти правила, будучи результатом обучения, должны стать объектами для использования знаний, поэтому и образуют язык представления знаний. И наоборот, язык представления знаний должен учитывать и определять указанные выше условия приобретения знаний.

2. Способы описания объектов. В случае обучения .по примерам из описаний отдельных объектов создаВнются еще более общие описания объектов некоторого класса, при этом возникает важная проблема: как описать данный класс объектов. В полном классе некоторых объектов следует определить меньший класс объектов, обладающих общим свойством (объВнекты только в этом классе обладают заданным свойством), но в действительности проще опредеВнлить список объектов и убедиться, что все объекты в нем обладают общим свойством. Для некотороВнго типа задач можно эффективно использовать ложВнные примеры или контрпримеры, убедительно покаВнзывающие, что данные объекты не входят в этот класс. Иллюстрацией применения контрВнпримеров может служить понятие Влпочти тоВ».

3. Правила обобщения. Для сбора отдельных примеВнров и создания общих правил необходимы правила обобщения. Предложено несколько способов их опиВнсания: замена постоянных атрибутов языка на переВнменные, исключение описаний с ограниченным приВнменением и т. п. Очевидно, что эти способы тесно свяВнзаны с языком представления знаний.

4. Управление обучением. В процессе обучения по примерам можно применять различные стратегии структуризации информации и необходимо управлять этим процессом в ответ на входные данные. СущестВнвуют два классических метода: метод Влснизу-вверхВ», при .котором, последовательно выбираются и структуВнрируются отдельные сообщения, и метод Влсверху-внизВ», при котором сначала выдвигается гипотеза, а затем она корректируется по мере поступления инфорВнмации. На практике эти методы комбинируются, хотя управление обучением с максимальным эффектом не такая уж простая проблема.

При изучении метода приобретения знаний по примерам можно выделить следующий ряд методов:

  1. Параметрическое обучение
  2. Обучение по аналогии
  3. Обучение по индукции.

Параметрическое обучение.

Наиболее простая форВнма обучения по примерам или наблюдениям состоит в определении общего вида правила, которое должно стать результатом вывода, и последующей корректиВнровки входящих в это правило параметров в зависиВнмости от данных. При этом используют психологиВнческие модели обучения, системы управления обучеВннием и другие методы.

Примером обучающейся системы этой категории в области искусственного интеллекта является сиВнстема Meta-Dentral. Эта система выводит новые праВнвила путем коррекции правил продукций в процессе обучения или на основе исходных массспектральных данных параметрическое обучение в ней представВнлено в несколько специфичном виде, но все же она относятся к указанной выше категории, поскольку в системе задана основная структура знаний, котоВнрая корректируется последовательно по отдельным данным.

Ярким примером применения этого метода приобретения знаний могут также служить системы распознавания образов (обсуждавшиеся ранее в другом докладе). В них ясно просматривается основной принцип этого метода - в ходе обучения нейронная сеть автоматически по определенным заранее законам корректирует веса связей между элементами и значения самих элементов.

Метод обучения по индукции.

Среди всех форм обучения необходимо особо выделить обучение на основе выводов по индукции - это обучение с использованием выводов высокого уровня, как и при обучении по аналогии. В процессе этого обучения путем обобщения совокупности имеюВнщихся данных выводятся общие правила. Возможно обучение с преподавателем, когда входные данные задает человек, наблюдающий за состоянием обуВнчающейся системы, и обучение без преподавателя, когда данные поступают в систему случайно. И в том и в другом случае выводы могут быть различными, они имеют и различную степень сложности в завиВнсимости от того, задаются ли только корректные данные или в том числе и некорректные данные и т. п. Так или иначе, обучение этой категории включает открытие новых правил, построение теорий, создание структур и другие действия, причем модель теории или структуры, которые следует создать, заВнранее не задаются, поэтому их необходимо разраВнботать так, чтобы можно было объяснить все праВнвильные данные и контрпримеры.

Индуктивные выводы возможны в случае, когда представление результата вывода частично опредеВнляется из представления входной информации. В поВнследнее время обращают на себя внимание проВнграммы генерации программ по образцу с испольВнзованием индуктивных выводов.

Как уже было сказано, индуктивный вывод тАФ это выВнвод из заданных данных объясняющего их общего правила. Например, пусть известно, что есть некотоВнрый многочлен от одной переменной. Давайте посмотВнрим, как выводится f(х), если последовательно заВндаются в качестве данных пары значений (0, f(0)), (1, f(1)), .. Вначале задается (0, 1), и естественно, что есть смысл вывести постоянную функцию f(х)=1. Затем задается (1, 1), эта пара удовлетворяет предложенной функции f{х)= 1. Следовательно в этот момент нет необходимости менять вывод. Наконец, задается (2, 3), что плохо согласуется с нашим выводом, поэтому откажемся от пего и после нескольВнких проб и ошибок выведем новую функцию f(х)==х2тАФх+1, которая удовлетворяет всем заданВнным до сих пор фактам (0, 1), (1, 1), (2,3). Далее мы убедимся, что эта же функция удовлетворяет фактам (3, 7), (4, 13), (5, 21) .., поэтому нет необВнходимости менять этот вывод. Таким образом, из последовательности пар переменная-функция можно вывести многочлен второй степени. Грубо говоря, такой метод вывода можно назвать индуктивным.

Как видно из этого примера, при выводе в каждый момент времени объясняются все данные, полученные до этого момента. Разумеется, данные, полученные позже, уже могут и не удовлетворять этому выводу. В таких случаях приходится менять вывод. СледоваВнтельно, в общем случае индуктивный выводтАФэто неВнограниченно долгий процесс. И это не удивительно, если вспомнить процесс освоения человеком языков, процесс совершенствования программного обеспечеВнния и т. п.

Для точного определения индуктивного вывода необходимо уточнить:

  1. множество правилтАФобъВнектов вывода,
  2. метод представления правил,
  3. способ показа примеров,
  4. метод вывода и
  5. критерий правильности вывода.

В качестве правилтАФобъектов выводатАФможно рассматривать главным образом индуктивные функВнции, формальные языки, программы и т. п. Кроме того, эти правила могут быть представлены в виде машины Тьюринга для вычисления функций, грамВнматики языков, операторов Пролога и другим споВнсобом. Машина ТьюрингатАФэто математическая модель компьютера, ее в принципе можно считать проВнграммой. В случае когда объектом вывода является формальный язык, он сам определяет правила, а его грамматика тАФ метод представления правил, поэтому говорят о грамматическом выводе.

Для показа примеров функции f можно использоВнвать последовательность пар (х,f(х)) входных и выВнходных значений так, как указано выше, последовательность действий машины Тьюринга, вычисляющей и другие данные. Задание машине выводов пары входных и выходных значений (х, f(х)) функции f соответствует заданию системе автоматического синВнтеза программ входных значений х и выходных знаВнчений f(х), которые должны быть получены програмВнмой вычисления f в ответ на х. В этом смысле автоВнматический синтез программ по примерам также можно считать индуктивным выводом функции f. Формальные языки тАФ это множество слов; поэтому, например, для языка L можно рассматривать ва типа слов, принадлежащих и не принадлежащих этому языку. Первые назовем положительными, а вторые тАФ отрицательными данными. Другими словаВнми, есть два способа показа примеров формального языка: с помощью положительных и отрицательных данных. Когда объектом служат сами программы, тогда то же самое можно говорить о функциях языка Лисп, но для Пролога показ примеров осуществляется в виде фактов. Например,   (3>4, истина), (2<=1, ложь). В этом случае положительным данным соотВнветствуют данные с атрибутом ВлистинаВ», а отрицаВнтельным тАФ данные с атрибутом ВлложьВ».

Вывод реализуется благодаря неограниченному повторению основного процесса

запрос входных данных -> предположение -> выходные данные.

Другими словами, при выводе последовательно поВнлучают примеры как входные данные, вычисляют предположение па данный момент и выдают резульВнтат вычислений. Предположение в каждый момент времени основано на ограниченном числе примеров, полученных до сих пор, поэтому обычно в качестве метода вывода используют машину Тьюринга, вычисВнляющую предположение по ограниченному числу приВнмеров. Такую машину назовем машиной выводов.

Учитывая, что индуктивный вывод, как уже было отмечено, это неограниченно продолжающийся проВнцесс, критерием правильности вывода, как правило, считают понятие идентификации в пределе. Это поняВнтие введено Голдом, оно используется почти всегда в теории индуктивных выводов. Говорят, что машина вывода М идентифицирует в пределе правило R, если при показе примеров К последовательность выходных данных, генерируемых М, сходится к некоторому представлению т, а именно: все выходные данные, наВнчиная с некоторого момента времени, совпадают с т, при этом т называют правильным представлением К. Кроме того, говорят, что множество правил Г позвоВнляет сделать индуктивный вывод, если существует некоторая машина выводов М, которая идентифициВнрует в пределе любое правило К из множества Г. Обратите внимание на то, что слова Влпозволяет сдеВнлать индуктивный выводВ» не имеют смысла для единВнственного правила, а относятся только к множеству правил.

Обучение по аналогии.

ПриобреВнтение новых понятий возможно путем преобразоваВнния существующих знаний, похожих на те, которые собираются получить. Это важная функция, которую называют обучением на основе выводов по аналогии или просто обучением по аналогии. В нашей жизни много примеров, когда новые понятия или техниВнческие приемы приобретаются с помощью аналогии

Выводы по аналогии - один из важных объектов исследования искусственного интеллекта, наиболее интересные результаты здесь получены П. Уинстоном. Он использует выводы по аналогии, основываясь на следующей гипотезе: ВлЕсли две ситуации подобны по нескольким признакам, то они подобны и еще По одному признакуВ». Подобие двух ситуаций распознается путем обнаружения наилучших совпадений по наиболее важным признакам.

АналогиятАФэто метод выводов, при которых обнаруВнживается подобие между несколькими заданными объектами; благодаря переносу фактов и знаний, справедливых для одних объектов, на основе этого подобия на совсем другие объекты либо определяется. способ решения задач, либо предсказываются неизВнвестные факты и знания. Следовательно, когда челоВнвек сталкивается с неизвестной задачей, он на первых порах использует этот естественный метод вывода.

Направления исследования аналогии

Одна из важнейших проблем инженерии знанийтАФ приобретение знаний. Под приобретением здесь поВннимается получение знаний в виде, пригодном для их использования компьютерами, поэтому многие исследователи указывают, что ключом к знаниям является теория и методология машинного обучения. В общем случае машинное обучение включает приобретение новых декларативных знаний, систематизацию и храВннение новых знаний, а также обнаружение новых фактов. Среди указанных форм обучения аналогия, о которой будет идти далее речь, связана, и частности, с проблемой машинного обнаружения новых фактов.

Под новыми фактами мы будем понимать факты, которые дедуктивно не выводятся из некоторых существующих знаний. Получение новых знаний также рассматривалось выше в отношении к индуктивному выводу . В общем случае при индукВнтивных выводах по заданным данным создается гиВнпотеза, их объясняющая, а с помощью дедукции из этой гипотезы можно вывести новые факты. С друВнгой стороны, при аналогии новые факты предсказыВнваются путем использования некоторых преобразоваВнний уже известных знаний.

Индукция и аналогия крайне необходимы при обВнработке интеллектуальной информации, и поэтому желательно изложить основы их совместного примеВннения. Шапиро ввел строВнгую формализацию индуктивных выводов в части выВнвода моделей с использованием логики предикатов первого порядка; в теории индуктивных выводов есть заметные успехи.

С целью обзора исследований аналогии, проведенВнных до настоящего времени, выделим два типа анаВнлогии: для решения задач и для предсказаний. АнаВнлогия первого типа применяется главным образом для повышения эффективности решения задач, котоВнрые, вообще говоря, можно решить и без аналогии. Например, благодаря использованию решений анаВнлогичных задач в областях программирования и доВнказательства теорем можно прийти к выводам о проВнграммах или доказательствах. С другой стороны, используя аналогию для предсказаний, благодаря преобразованию знаний на основе подобия между объектами можно сделать заключение о том, что, возможно, справедливы новые факты. Например, если объектами аналогии является некая система аксиом, то знаниями могут быть теоремы, справедливые в этой системе. При этом, используя схожесть между системами аксиом, можно преобразовать теорему в одной из систем в логическую формулу для другой системы и сделать вывод о том, что эта формула есть теорема. Другими словами, аналогия используется и для решения некоторых строго сформулированных задач и для предсказаний, а также для приобретения не заданной ранее информации.

Примером использования метода приобретений знаний по аналогии может служить система доказательства теорем. При этом общая схема вывода выглядит следующим образом.

Рис. 3 Стратегия абстрагирования.

Вместе с этим смотрят:

Механизм генерации транзактов в модели
Микропроцессоры для пользователя
Микропроцессоры семейства Intel
Мировая сеть FIDOnet