<< Пред.           стр. 7 (из 8)           След. >>

Список литературы по разделу

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Рис. 21. Иерархия агрегации
 
 
 
 Характеристики основных методологий ER- моделирования Табл. 2
 
 
 Наименование характеристик Чен Бахман Джексон Диго Oracle IDEF
 Количество видов сущностей 1 1 1 3 2 3
 Количество видов отношений по числу входящих экземпляров 3 3 3 3 3 2
 Наличие n-арных отношений + - + - - -
 Возможность отображения отношений «род-вид» - + - + + +
 Вид даталогической модели, для которой предложены алгоритмы преобразования сетевая сетевая реляционная сете-вая
 реля-ционная,
 на инв. файлах реляционная реля-ционная
 Наличие средств автоматизации - - - - + +
 
 Допускаются следующие типы связей в структуре связей объектов:
 N- арные связи;
 рекурсивные связи;
 несколько связей для одной и той же пары объектов.
 Например,
 
 
 
 
 
 
 
 Рис. 22. Варианты связей между сущностями и связями
 
 Таким образом, соответствующий тип инфологической модели при проектировании АЭИС способствует правильному выбору алгоритма перехода к даталогической модели и позволяет дать рекомендации по проектированию физической структуры базы данных.
 Элементами семантического представления являются понятия и семантические (смысловые) отношения между ними. Теоретико-графовое представление такого уровня называется семантической сетью. Аппарат семантических сетей является естественной формализацией ассоциативных связей, которыми пользуется человек при извлечении каких-то новых фактов из имеющихся. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации и т. п.
 Семантическая сеть – это ориентированный граф с помеченными дугами.
 Обычно в семантической сети предусматривается четыре категории вершин:
 понятия (объекты);
 события;
 свойства;
 значения.
 Понятия – это константы или параметры, которые определяют физические или абстрактные объекты. События – это действия, происходящие в реальном мире, и определяются указанием типа действий и ролей, которые играют объекты в этом действии. Свойства используются для представления состояния или модификации понятий и событий.
 Сведения семантической сети образуют сценарий, который является набором понятий, событий, причинно-следственных связей.
 В семантической сети вершины могут обозначать экземпляры объектов и классы объектов. Например, Иванов – экземпляр типа Студент. Экземпляр может принадлежать более, чем одному классу. Иванов – Студент и Спортсмен. Различие между вершинами сети приводит к существованию трех дуг:
 дуга, соединяющая два экземпляра, соответствует утверждению;
 дуга между классом и элементом класса показывает пример элемента класса;
 дуга, связывающая два класса, определяет бинарное отношение классов.
 Связи понятий образуют в общем случае сетевую структуру.
 При установлении структуры понятий используются две обязательные связи:
 связь «есть-нек» (от слов есть некоторый), направленная от частного понятия к общему и показывающая принадлежность элемента к классу;
 связь «есть-часть», показывающая, что объект содержит в своем составе разнородные объекты, не подобные данному объекту.
 Для составления семантической сети предварительно выделяются простые отношения, которые характеризуют основные компоненты события. В первую очередь из события выделяется действие, описываемое глаголом. Далее необходимо определить объекты, которые действуют и над которыми осуществляются действия.
 Обычно рассматриваются следующие падежи:
 агент – предмет, являющийся инициатором действия;
 объект – предмет, подвергающийся действию;
 источник – размещение предмета перед действием;
 приемник – размещение предмета после действия;
 время – указание на то, где происходит событие;
 место – указание на то, где происходит событие;
 цель – указание на цель действия.
 Семантические сети имеют ряд преимуществ:
 описание событий и объектов производится на языке, близком к естественному;
 возможность выделить из полной сети, представляющей всю семантику некоторый участок, который охватывает необходимые в данном запросе смысловые характеристики;
 обеспечивается возможность сцепления различных фрагментов сети;
 возможные отношения между понятиями и событиями образуют достаточно небольшое, хорошо формализованное множество.
 На рисунке 23 представлен пример семантической сети .
 Выбор конкретной модели при описании предметной области определяется рядом требований, таких как: теоретическая основа модели данных; наглядность, визуальная представимость; легкость информационного моделирования; простота декомпозиции; совместимость с другими моделями; независимость от аппаратной реализации.
 
 
  Личность
 
  есть-нек
 
 
  изучает
  Студент курс
 
  есть-часть
  есть-часть есть-часть
 
  есть-часть
 № зачетной книжки Фамилия Факультет Год рождения
 
 
 Рис. 23. Семантическая сеть объекта «Личность»
 
 
 § 4.2. Тезаурусы экономической информации
 
 Сущность самоотображения системы наиболее точно выражается тезаурусом, который также считаем одним из видов информационного моделирования. Термин thesaurus был впервые применен еще в Х111 веке Брунетто Латини как название энциклопедии.
 Термин «тезаурус» является общеупотребительным и общепринятым термином как элемент информационного языка, позволяющего фиксировать парадигматические* отношения и отношения синонимии между понятиями предметной области.
 Тезаурус – это словарь-справочник, в котором перечисляются все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые отношения между лексическими единицами.
 В общем случае тезаурусом принято называть конечное непустое множество Т слов t, отвечающих условиям:
 Имеется непустое множество T0 ? T, называемое множеством дескрипторов;
 Имеется симметричное, транзитивное рефлексивное отношение R ? T
 при этом отношение R называется синонимическим отношением, а слова t1, t2, отвечающие этому отношению, называются синонимическими дескрипторами;
 имеется транзитивное и несимметричное отношение K ? T0 ? T0, называется обобщающим отношением.
 В случае, если два дескриптора t1 и t2 удовлетворяют отношению t1 K t2, то полагается, что дескриптор t1 более общий, чем t2.
 В тезаурусе дескрипторы распределены по семантическим категориям, внутри категорий по семантическим типам. Состав словарной статьи дескриптора переменный и зависит прежде всего от семантической категории дескриптора и семантического типа.
 При построении тезауруса, в общем случае, широко используется аппарат информационного исчисления искусственного интеллекта, основанный на двоичной логике Аристотеля, непрерывной логике Заде, когнитивной графике Эйлера, языке диаграмм Чена, формальной грамматике Холмского.
 Основные этапы разработки тезауруса можно свести к следующим:
 Выбор источников лексики и отбор терминов.
 Составление терминологического словаря.
 Группировка терминов в тематические классы.
 Формирование классов условной эквивалентности.
 Установление парадигматических отношений.
 Определение структуры тезауруса.
 Для отбора лексического материала используют экономические документы, отражающие качественные и количественные характеристики объектов, а также толковые словари, справочники, классификаторы.
 В терминологическом словаре каждому отобранному термину дается определение, соответствующее его экономическому смыслу. Все термины классифицируются в зависимости от функционального назначения в тематические классы.
 При составлении тезауруса необходимо устранить многозначность (омонимия, полисемия). Они могут быть устранены лексикографически при редактировании терминологического словаря.
 Омонимия – совпадение в звучании и написании разных слов, которые не имеют ничего общего ни по происхождению, ни по функционированию. Например, клетка (элементарная живая система) и клетка (для содержания животных).
 Полисемия – перенос названия одного предмета на другие предметы на основании сходства (по форме, внутренним свойствам и т.д.). Например, сумка (предмет гардероба) и сумка кенгуру.
 Синонимия – явление естественного языка, заключающееся в том, что одному предмету или явлению соответствует несколько слов. Устранение синонимии происходит путем группирования терминов в классы условной эквивалентности (КУЭ).
 В КУЭ объединяются термины, между объемами понятий которых существуют отношения:
 равнозначности, когда объемы понятий полностью совпадают (директория, каталог, папка);
 перекрещивания, когда лишь часть объема одного понятия входит в объем другого понятия и, в свою очередь, лишь часть объема второго понятия входит в объем первого понятия (книга – монография);
 подчинения, когда объем одного понятия составляет часть объема другого понятия (дисковод – системный блок);
 внеположенности, когда объемы понятий полностью исключают друг друга и при этом не исчерпывают области предметов, о которых ведутся рассуждения (чашка, ложка: общий класс – посуда).
 Любое из этих отношений может быть использовано для группировки в классы условной эквивалентности.
 В каждом синонимическом ряду выделяется слово, которое может заменить любое слово класса. Оно называется дескриптором и имеет форму существительного.
 Основными критериями для выбора термина являются:
 полнота выражения смыслового значения данного класса условной эквивалентности;
 значимость термина для поиска информации;
 научно-техническая точность термина и возможность его использования для индексирования;
 распространенность термина;
 краткость термина и понятность его для неспециалиста;
 частота появления термина в различных источниках;
 частота первичного использования термина при индексировании и поиске.
 Парадигматические отношения могут выражаться четырьмя способами:
 лексикографически;
 при помощи таблиц;
 аналитически;
 графически.
 Лексикографический способ предполагает наличие специальных помет, которые указывают, в каких парадигматических отношениях находится данный дескриптор с заглавным.
 Табличный способ заключается в том, что под заглавным дескриптором записываются со сдвигом на несколько знаков вправо дескрипторы, находящиеся с заглавным дескриптором в определенном отношении. Такой способ применяется в библиотечно-библиографических классификациях.
 При аналитическом способе парадигматические отношения выражаются при помощи структуры кодов дескрипторов.
 Примером применения аналитического способа может служить универсальная десятичная классификация.
 Графический способ предполагает применение различных графических схем.
 Для выражения парадигматических отношений наиболее часто используется сочетание лексикографического и табличного способов с применением обозначений, рекомендуемых ГОСТом:
 н – нижестоящий видовой дескриптор по отношению к заглавному дескриптору;
 в – вышестоящий родовой дескриптор по отношению к заглавному дескриптору
 ц – дескриптор находится в отношении – целое к заглавному дескриптору;
 ч - дескриптор находится в отношении – часть к заглавному дескриптору;
 с – ключевое слово находится в отношении синонимии к заглавному дескриптору;
 см – отсылка от ключевого слова к дескриптору.
 Тезаурус представляет собой совокупность расположенных с алфавитном порядке дескрипторных статей. Например,
 Для систематизации обширного класса сведений может использоваться новый тип информационных моделей – гипертекст или нелинейный текст, совмещающий положительные свойства энциклопедии, монографии и тезауруса.
 Термин гипертекст введен В.Бушем и конкретизирован Т. Нельсоном Гипертекст – это многомерный текст, чтение которого можно осуществлять в нескольких направлениях.
 Математическую модель гипертекста представляется следующим образом:
 Пусть M и R конечные непустые множества
 M = {m1, m2, …,mn}; R = {R1,R2, …, Rk}.
 Элементами множеств М и R обозначены объекты и отношения между ними. Тогда гипертекст, в наиболее общем виде, описывается как совокупность следующих четырех компонентов:
 Г0 = (Е, I, S, Q),
 где Е – тезаурус гипертекста;
 I – информационная составляющая гипертекста, включающая в себя содержание информационных статей Ii, в которые помещаются сведения о всех mi ? M , т.е. I = ;
 S – алфавитный (или хронологический) словарь всех наименований mi ? M;
 Q – список главных тем гипертекста.
 Тезаурус гипертекста состоит из тезаурусных статей, каждая из которых может быть представлена в виде:
 ti = { mi, Ami},
 где ti- тезаурусная статья объекта mi;
 Ami – множество объектов, с которыми mi связан отношениями из R указанием типа отношения.
 Тезаурус является главной частью гипертекста, служащей основой для систематизации и поиска сведений. Попытка описания гипертекстовой структуры в рамках реляционной модели не дает желаемого результата в силу статичности самой модели и отсутствия поддержки ассоциативного поиска Попытки формализации гипертекстовой модели и создания некоторых стандартов были предприняты Бейбером , Дейкстрой , Фурутой, Скотсом и др. В основном авторы моделей используют сетевой подход к построению моделей. Гипертекстовая структура, представляемая в виде сети с вершинами (концептами) и связями (отношениями), является наиболее удобной для создания больших интеграционных систем. Вершина может содержать текст, графику, анимацию, аудио, видеофрагменты и другие формы информации. Связи между вершинами двунаправленные, посредством чего осуществляется навигация по сети в различных направлениях.
 Примером, свидетельствующим о популярности гипертекстовых технологий, является организация всемирной информационной сети Internet.
 Гипертекстовая модель обладает рядом недостатков, связанных с жесткостью существующих связей и условий поиска, невозможностью передачи информации из одной системы в другую. Тем не менее, модель находит широкое применение в системах обработки экономической информации, т.к. гипертекстовая структура дает возможность связывать разнотипные информационные объекты в единое приложение, поддерживает ассоциативный поиск. Гипертекстовая модель может применяться для семантического моделирования, анализа и сравнения экономических категорий, установления корректности понятий и терминов, в учебных процессах, для системного контроля фонда нормативно-правовых документов по вопросам экономики на полноту, непротиворечивость, избыточность.
 
 В заключении отметим, что анализ основных типов моделей экономических систем позволяет сформулировать требования, которым должен отвечать аппарат моделирования:
 обеспечивать учет особенностей экономической информации;
 обеспечивать разнообразие (видов) форм представлений объектов предметной области (графическое, текстуальное, алгоритмическое и др.);
 позволять строить многомерное отображение предметной области, на основе которого могут быть формализованы требования к системе обработки данных
 обеспечивать устойчивость проектных решений к изменениям информационной сферы предметной области;
 давать возможность описывать широкий класс понятий, используемых для адекватного представления объектов предметной области;
 Выбор конкретной модели при описании предметной области определяется рядом требований, таких как: теоретическая основа модели данных; наглядность, визуальная представимость; легкость информационного моделирования; простота декомпозиции; совместимость с другими моделями; независимость от аппаратной реализации.
 
 Вопросы и задания
 
 1. Какие условные обозначения рекомендованы ГОСТом для определения парадигматических отношений и отношений синонимии?
 2. Что такое тезаурус и какова его роль в экономических информационных системах?
 3. Назовите падежи, используемые в семантических сетях для представления событий и действий?
 4. Какие Вы знаете синтаксические модели данных и семантические модели и в чем их различие?
 5. Что такое атомарный объект и атомарный факт?
 6. Назовите варианты соответствий между сущностями и связями?
 7. Каковы недостатки модели "сущность-связь"?
 8. Назовите принципы, по которым термины объединяются в классы условной эквивалентности?
 
 
 
 Глоссарий
 
 Агрегация – процедура структуризации данных. Заключается в конструировании объекта из других базовых объектов, на основе чего создается агрегативная модель. Соотносится с понятием «есть некоторые».
 
 Атрибут – элементарное данное, описывающее свойство сущностей.
 
 Ациклическая база данных – класс реляционных баз данных, для которых характерна однозначная декомпозиция на основе многозначных зависимостей.
 
 Граф – графическая схема, включающая основные элементы графа, называемые вершинами и дугами.
 
 Граф ориентированный – граф, в котором каждое ребро ориентировано, т.е. определен путь от одной вершины к другой.
 
 Даталогическая модель – модель логического уровня описания системы, состоящая из логических записей и отображения связей между ними безотносительно к виду реализации.
 
 Домен – множество значений атрибута.
 
 Иерархическая модель – модель структуры процесса или системы, структурная схема которой является ориентированным графом. Состоит из совокупности исходных и порожденных типов записей, связанных одной или несколькими дугами. Допускает связи уровней типа один ко многим или один к одному.
 
 Инфологическая модель – описательная модель предметной области, независимая от структуры данных. Обычно состоит из совокупности информационных объектов, атрибутов и отношений между ними. Отражает динамику предметной области.
 
 Информационная система – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, поиска обработки и выдачи информации по запросам пользователей.
 
 Метаданные – дополнительные данные о данных.
 
 Моделирование информационное – моделирование, связанное с созданием и преобразованием разных форм информации, например, например, графической или текстовой , в вид, задаваемый пользователем.
 
 Моделирование семантическое – моделирование, связанное с задачами кодирования и лингвистического обеспечения.
 
 Модель инвертированных файлов – частный случай сетевой двухуровневой модели данных, служит основой для современных информационно-поисковых систем.
 
 Модель «сущность-связь» - графовая модель, дающая представление о предметной области в виде объектов, называемых сущностями, между которыми фиксируются связи. Для каждой связи определено число связываемых ею объектов.
 
 Нормализация отношений – процесс преобразования отношений базы данных к той или иной нормальной форме.
 
 Обобщение – процедура абстракции (структуризации) данных, соотносится с понятием « есть часть». Обобщение акцентирует сходство объектов, абстрагируясь от различий.
 
 Отношение – множество кортежей, описывающих класс объектов.
 
 Организация значений данных – относительно устойчивый порядок расположения записей данных в памяти ЭВМ и способ обеспечения взаимосвязи между записями.
 
 Первичный ключ – атрибут или комбинация атрибутов, значения которых однозначно идентифицируют каждый кортеж в реляционной модели.
 
 Последовательная организация данных – записи располагаются в памяти строго одна за другой, без промежутков, в той последовательности, в которой они обрабатываются.
 
 Предметная область – подмножество (часть реального мира), на котором определяется набор данных и методов манипулирования с ними для решения конкретных задач или исследований.
 
 Реляционная модель – табличная модель данных, основным средством структуризации в которой является отношение.
 
 Сущность – элемент модели (совокупность атрибутов и знаков), описывающий законченный объект или понятие.
 
 Экономическая информация – информация об экономических процессах, таких как производство, потребление, распределение и т. д.
 
 Экономическая информационная система – система, предназначенная для хранения, обработки, поиска и выдачи информации.
 
 Экономический показатель – полное описание количественного параметра, характеризующего некоторый объект или процесс.
 
 
 Список литературы
 
 Бусленко Н.П. Моделирование сложных систем / Н.П. Бусленко. – 3-е изд. – М.: Наука, 1978. – 399 с.
 Информатика: Учебник /Под ред. Н.В. Макаровой. – 3-е изд. – М.:Финансы и статистика, 1999. – 768 с.
 Компьютерные системы и сети: Учеб. пособие/ В.П. Косарев и др.;Под ред В.П. Косарева и Л.В.Еремина. – М.: Финансы и статистика, 1999. – 464с.
 Королев М.А. Теория экономических информационных систем / М.А. Королев, А.И. Мишенин , Э.Н. Хотяшов. - М.: Финансы и статистика, 1984. – 223 с.
 Мишенин А.И. Теория экономических информационных систем / А.И. Мишенин. – М.: Финансы и статистика, 1999 г.
 Цикритзис Д., Модели данных / Д. Цикритзис, Ф. Лоховски . - М.: Финансы и статистика, 1985. – 344 с.
 Экономическая информатика /Под ред. П.В. Конюховского и Д.Н. Колесова. – СПб.: Питер, 2000. – 560 с.
 
 ВВЕДЕНИЕ 2
 ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ ЭКОНОМИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМ 5
 § 1.1. Информационная система в общем виде. 5
 § 1.2. Компоненты экономических информационных систем 15
 § 1.3. Операции над единицами информации. Экономические показатели 23
 ГЛАВА 2. МОДЕЛИ ДАННЫХ 26
 § 2.1. Реляционная модель данных 26
 § 2.1.1. Основные понятия реляционной модели данных 26
 § 2.1.2.Реляционная алгебра 28
 § 2.1.3. Операции над отношениями с применением конструкций языка SQL 33
 § 2.1.4. Нормализация отношений 39
 § 2.1.5. Ациклические базы данных 47
 § 2.2. Сетевая и иерархическая модели данных 48
 § 2.2.1. Основные понятия сетевой модели данных 48
 § 2.2.2. Организация веерного отношения в памяти ЭВМ 49
 § 2.2.3. Алгоритм получения двухуровневой структуры сети 51
 § 2.2.4. Иерархическая модель данных 53
 § 2.3. Сравнение моделей данных 55
 § 2.4. Модель инвертированных файлов и информационно поисковые системы 58
 ГЛАВА 3. МЕТОДЫ ОРГАНИЗАЦИИ ДАННЫХ 63
 § 3.1. Анализ алгоритмов и структур данных 63
 § 3.2. Сравнение методов организации данных 65
 § 3.3. Цепная (списковая) организация данных 68
 § 3.4. Цепной каталог 71
 § 3.5. Древовидная организация данных 71
 ГЛАВА 4. МОДЕЛИРОВАНИЕ ПРЕДМЕТНЫХ ОБЛАСТЕЙ В ЭКОНОМИКЕ 75
 § 4.1. Семантические модели данных 81
 § 4.2. Тезаурусы экономической информации 88
 Глоссарий 89
 Список литературы 91
 
 
 

<< Пред.           стр. 7 (из 8)           След. >>

Список литературы по разделу