•Они связаны с основной производственной деятельностью организации.
•На них существуют жесткие маршруты прохождения документов (можно и нужно применять системы жесткой маршрутизации).
•Они работаю с структурированными документами.
•Документы подвергаются сложной и специфической обработке или имеют развитую семантику, которую нужно программно проверять и поддерживать (контракт-счет-накладная).
С маршрутов обработки документов возможен выход в общую систему делопроизводства, например, для обсуждения проекта документа или для получения справок из других отделов или подразделений предприятия. В общем делопроизводстве основная схема работы с заданиями и документами - это свободная маршрутизация. Оно отвечает за сбор и распределение информации, за связи с внешними организациями (вне основного производственного процесса). Во все специализированные системы делопроизводства от нее есть отростки для обмена информацией.
Методы и средства автоматизации учрежденческой деятельности
Долгое время автоматизация учреждений в России осуществлялась в виде различного рода подсистем АСУ, основанных на базах данных (кадры, канцелярия, бухгалтерия, зарплата, контроль исполнения и др.) Не умоляя значимости этих подсистем, заметим, что они охватывали лишь до 15-20% общего объема информации, циркулирующей в учреждении.
Нужды по электронной обработке документов удовлетворялись применением функциональных пакетов (редакторов текста и электронных таблиц) и интегрированных пакетов программ Microsoft Office, Perfect Office, Lotus Smart Suite. Эти средства оказались недостаточными для управления огромными потоками бумажных и электронных документов, циркулирующих как внутри одного предприятия, так и между ними. В целом такой подход грешил отсутствием комплексности в автоматизации делопроизводства и управления документооборотом.
В настоящее время развитие информационных технологий привело к появлению методов и средств, обеспечивающих интегрированные решения по автоматизации офиса, позволяющие автоматизировать ручные операции и поиск документов, автоматически передавать и отслеживать перемещение документов и контролировать выполнение поручений, связанных с документами.
Методы автоматизации учреждений
Рассмотрим основные методы автоматизации учрежденческой деятельности. Современные организации представляют собой совокупность подразделений, филиалов, отделов и офисов, обменивающихся между собой информацией и выполняющих отдельные части общей работы. Основными фазами жизни неструктурированной информации в офисе являются:
•ввод информации в систему,
•хранение, навигация, поиск и фильтрация документов,
•коллективного работа с документами,
•вывод информации из системы.
Существуют различные способы ввода информации в систему. Это прежде всего сканирование документов и сохранение их в виде графических образов. В системах первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов для последующего поиска необходимой информации (например: система SoftSolutions). Позднее стала применяться технология оптического распознавания символов OCR (Optical Character Recognition). После сканирования и ввода документа в систему его графический образ “переводится” в текст, затем следует исправление ошибок распознавания.
При массовом ручном вводе однотипных документов используются электронные формы, которые обеспечивают структуризацию документа путем выделения частей текста и добавления полей (атрибутов), что позволяет упростить заполнение документов и выполнить необходимые вычисления. Информация в офис может поступать и путем импорта файлов с магнитных носителей или по телекоммуникациям (факсы, сообщения электронной почты и т.п.).
Ввод информации сопровождается классификацией документов путем задания атрибутов и ключевых слов, аннотированием их содержания. Для ускорения последующего контекстного поиска производится полнотекстовое индексирование документов.
Важное значение для организации эффективного управления неструктурированными документами имеют методы хранения информации, навигации, поиска и фильтрации документов.
Документы могут храниться просто в файловой системе, и при этом система каталогов служит средством группирования и навигации в хранилище документов. В современных ОС типа Windows 95 есть возможность задания длинных имен каталогов и файлов в качестве названий папок и документов, а также имеются соответствующие средства поиска файлов по их параметрам.
Ряд систем, основанных на электронной почте, хранят документы в почтовых ящиках в виде почтовых сообщений с присоединенными файлами. Навигация в хранилище упрощается с помощью вложенных папок личного и коллективного пользования. Однако в таких системах поиск и фильтрация ограничены лишь отбором и сортировкой документов по атрибутам и тексту почтового сообщения.
Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы документов. База документов может хранить как однотипную так и разнотипную информацию в виде одного файла. Документы допускают внутреннюю структуризацию на основе формуляров путем выделения и добавления полей в документе. Навигацию в базе документов упрощает наличие страниц баз документов и категорий документов. Почтовые сообщения также хранятся в виде базы документов, файлы произвольного вида допускается присоединять к текстовым документам.
Многие современные системы электронных документов используют в дополнение к файловой системе так называемые библиотеки документов, содержащие в БД карточки документов с атрибутами и ключевыми словами. Для логической группировки документов применяются папки.
Поиск и фильтрация документов производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса. При использовании механизма четкого поиска (например, DOCS OPEN) в запросе не должно быть орфографических ошибок, а в тексте документа - ошибок распознавания. При этом может морфологический разбор позволяет упростить
Недавно на основе нейронных сетей и искусственного интеллекта реализована технология нечеткого поиска по полному содержанию документа (например, технология адаптивного распознавания образов APRP в пакете Excalibur EFS). Нечеткий поиск не требует полного соответствия искомых фраз с содержимым документов, кроме того, исключает потребность в исправлении ошибок после распознавания текста. Система поиска всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса.
Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы хранения - текстовые и универсальные БД. Тексты документов хранятся в символьных полях переменной длины, расширенные средства SQL-поиска позволяют формировать смешанные запросы для поиска по атрибутам и контекстного поиска, а дополнительные функции обеспечивают обработку текста Для хранения произвольной информации, в том числе мультимедиа, можно использовать поля бинарных объектов большой длины BLOB и/или гипертекст. СУБД, расширенные для поиска и обработки такой информации, образуют универсальные сервера БД. Другой способ хранения документов произвольного содержания реализуют объектно-ориентированные БД (например, Informix Illustra).
Феномен распределенного гипертекста составляет основу широко внедряемой Web- технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа осуществляется путем форматирования, выделения полей, создания форм для диалогового заполнения документа и организацией внутренних гипертекстовых ссылок. Допускается создание гипермедиа включением любой мультимедиа-информации (растровая графика, аудио, видео). Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах). Кроме того, для определения местонахождения документов служит контекстный поиск. Для ускорения поиска информации в “паутине” применяются специальные программы-роботы, сканирующие Web- сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного учреждения и упростить диалоговый интерфейс пользователя, что наиболее важно при разработке информационных приложений для руководителей. )