Організація інформаційної бази систем оброблення економічної інформації

12

Тема 4. Організація інформаційної бази систем оброблення економічної інформації.

1.Загальна характеристика інформаційного забезпечення.

2. Позамашинна інформаційна база.

3. Машина інформаційна база.

  1. Основи інформаційних систем Ситник В.Ф., Писаревська Т.А., Єрьоміна Н.В. Краєва О.С. К.:КНЕУ, 2001 с. 128-144-113.

1. Загальна характеристика інформаційного забезпечення.

Інформаційне забезпечення є однією із найбільш важливих організаційно-методичних передумов успішного рішення за допомогою обчислювальної техніки задачі з аналізу економічної діяльності клієнтів банка.

Інформаційне забезпечення - це сукупність форм документів, нормативної бази і реалізованих рішень по обсягу, розміщенню та формам організації інформації, що циркулює в системі автоматизованої обробки економічної інформації чи в інформаційній системі.

Створення інформаційного забезпечення відбувається за такими основними принципами :

цілісності;

достовірності;

контролю;

захисту від несанкціонованого доступу ;

єдності і гнучкості;

стандартизації та уніфікації;

адаптивності;

мінімізації помилок вводу-виводу інформації.

Держстандарт 24. 104-85 висуває такі вимоги до інформаційного забезпечення ( ІЗ ) :

1. ІЗ має бути достатнім для виконання всіх автоматизованих функцій.

2.Для кодування інформації мають використовуватися класифікатори які є у замовника.

3. Для кодування вихідної інформації, яка застосовується на вищому рівні, мають застосовуватися класифікатори цього рівня.

4. ІЗ системи має бути сумісним з ІЗ систем, що взаємодіють з нею по змісту, системі кодування, форматам даних та формою подання інформації.

5.Форми вхідних і вихідних документів мають відповідати вимогам стандартів чи нормативно-технічній документації замовника.

6.Форми вхідних і вихідних документів мають бути узгодженими з замовником.

7.Терміни і скорочування, що застосовуються у вихідних документах мають бути звичними у даній предметній області і узгоджені з замовником.

8.В системі мають бути передбачені методи контролю і відновлення даних.

Розробка інформаційного забезпечення є однією з найважливіших частин розробки інформаційної системи , яка повинна забезпечити:

– єдність і зберігання інформації, необхідної для розв’язання задач;

– єдність інформаційних масивів для всіх задач інформаційних систем;

– однократність вводу інформації і ЇЇ багатоцільове використання;

– різні методи доступу до даних;

–низьку вартість витрат на зберігання та використання даних, а також на внесення змін.

Інформаційне забезпечення складається з наступних частин:

– методичні і інструкційні матеріали;

– система класифікації і кодування;

– інформаційна база.

Однією з основних частин інформаційного забезпечення є інформаційна база – сукупність упорядкованої інформації, яка використовується при функціонуванні ІС і поділяється на внутрішньо машинну і позамашинна.

Внутрішня машинна інформаційна база – це частина ІБ, яка являє собою сукупність даних на машинних носіях, які використовуються в ІС.

Позамашинна інформаційна база – це частина ІБ, яка являє собою сукупність повідомлень, сигналів і документів, призначених для безпосереднього сприйняття людиною без використання засобів обчислювальної техніки.

При розробці ІЗ використовуються такі нормативні документи:

1.ГОСТ 24.104-85, 2.ГОСТ 6.01.1-87, 3.ГОСТ 19.2-75

2. Позамашинна інформаційна база.

Позамашинна ІБ - це частина ІБ , яка складається із сукупності повідомлень, сигналів і документів, що використовується при функціонуванні комп'ютерних ІС у формі, яка сприймається людиною без застосування засобів обчислювальної техніки.

До неї відносяться система економічних показників; система класифікації і кодування техніко-економічної інформації; система первинної і зведеної документації ; засоби формалізованого описання інформації; методичні та інструктивні матеріали, первинні та результатні документи.

Система економічних показників - це сукупність взаємопов'язаних соціальних, економічних і техніко-економічних показників, які відображають економічні процеси в суспільстві і використовуються при розв'язанні економічних задач в комп'ютерних ІС різного рівня і призначення.

Систему класифікації і кодування в ІС складає сукупність загальнодержавних, галузевих і локальних класифікаторів та програм Їх ведення.

Система первинної і зведеної документації, яка використовується в ІС дуже різноманітна. Вона розподіляється на нормативно-довідкову, оперативну, планову і звітно-статистичну.

Нормативно-довідкові документи містять довідкові і нормативні дані, які забезпечують розв`язання функціональних задач. Оперативні документи містять інформацію одноразового використання, наприклад, результати соціального обстеження, фактичний виробіток і т.ін. Планові документи згідно з різними формами звітності містять планову інформацію, а звітно-статистична документація - фінансові результати об'єкту управління.

До засобів формалізованого описання інформації відносяться: словники термінів, за допомогою яких здійснюється декодування інформації, яка виводиться з ЕОМ; мови і засоби спілкування користувачів з ЕОМ.

Методичні та інструктивні матеріали ІС - це методичні і первинні документи по державній системі ведення загальнодержавних класифікаторів; використанню мовних засобів; формуванню баз даних та знань і т. д.

Приклади

  1. б/о у промисловості

при нарахуванні заробітної плати :

  • Декрет від 26.12.1992 № 13-92" Про прибутковий податок з громадян" (зі змінами і доповненнями, внесеними Законами України від 01.07.1993р. №3355-ХІІ, від 14.02.1996р. 46.96 ВР, від 12.09.1996 р. № 366.96-ВР. Від 13.02.1998р. №126.98-ВР і Декретом КМУ від 30.04.1993р КМУ від 30.04.1993р. №43-93.
  • Закон України "Про збір на обов'язкове соціальне страхування" від 26.06.1998р.

2) у банківській сфері діяльності

Постанови Мін. фінансів, Мін. Статистики :

- ЗАКОН України " Про банки і банківську діяльність "

  • Постанова Правління національного банку України від 21 грудня 1993 р. з обліком наступних змін " Про економічні нормативи регулювання діяльності комерційних банків".
  • Постанова НБУ від 29 вересня 1997р №323 «Про порядок формування та використання резервів для відшкодування можливих втрат за позиками комерційних банків».

Первинний документ - це бланк встановленої форми, заповнений необхідними даними і підписаний посадовими особами, що надає йому юридичну силу.

Документи заповнюються вручну або з використанням обчислювальної техніки. Комп'ютеризація процесів управління приводить до розповсюдження формування і уводу в пам'ять ЕОМ аналогів первинних документів. Удосконалення інформаційного забезпечення комп'ютерних систем з УТР нерозривно пов'язане з удосконаленням форм первинної документації і, в першу чергу, Їх уніфікацією

Уніфіковані форми первинних документів розробляються окремими міністерствами і відомствами, а затверджуються Міністерством статистики, Міністерством фінансів України . Крім того вони реєструються Держстандартом України .

Форми представлення вихідної результатної інформації залежать від ЇЇ призначення та експлуатаційних можливостей технічних засобів обробки даних. В умовах обробки інформації на ЕОМ усі вихідні документи формуються спочатку на машинних носіях, а потім відображаються у формі машинограм або відеограм. Відображення результатної інформації в вихідних документах здійснюється у двох режимах: регламентнім і запитовим.

При регламентнім режимі машинограми друкуються згідно з планом у раніше обумовлені терміни.

Запитовий режим забезпечує видачу результатної інформації у будь - який час, коли виникає в цьому потреба.

3. Машина інформаційна база.

Машинна інформаційна база - це сукупність даних, які фіксуються в оперативних засобах пам'яті ЕОМ, на спеціалізованих машинних носіях і використовуються для електронної обробки.

При розробці внутрішньо машинної інформаційної бази особливу увагу приділяють тому, щоб дані, які зберігаються в ній, можна було широко використовувати і щоб способи використання даних можна було легко змінити.

Як правило, до складу машинної ІБ входять такі різновиди інформаційних масивів: нормативно-довідкові, оперативні, проміжні та результативні.

Умовно постійні масиви вміщують інформацію , яка використовується на протязі довгого часу .

Умовно постійні масиви у своєму складі мають нормативно довідкові відомості тому вони ще мають назву нормативно - довідкові масиви .

Приклади масивів НДІ для учбового закладу.

- довідник викладачів,

- учбовий план,

- довідник студентів,

- перелік дисциплін, що викладаються.

Ця частина ІБ на протязі року не змінюється.

Масиви нормативно–довідкової інформації можуть використовуватись при реалізації вводу даних, вони також використовуються для контролю введеної інформації на наявність ЇЇ в файлах НДІ.

Умовно - змінні масиви зберігають поточну інформацію.

Приклади оперативних масивів:

- відомості про розклад, відвідування занять ,

- атестації студентів.

При розподіленій обробці створенням та ведення масивів НДІ займається група Адміністратора БД; оперативні масиви строюються та ведуться у підрозділах які виколють розрахунки.

Кожен масив з точки зору логічної організації масиви характеризуються

1. Обсягами - кількістю записів, символів , байтів.

2. Стабільністю інформаційного масиву , яка у кількісному відношенні характеризується коефіцієнтом стабільності.

3. Ступені активності ( використання даних) . Кількісне вираження активності даних описується коефіцієнтом активності . Це число даних Які приймають участь у процесі обробки як початкові для отримання результатної інформації до загальної кількості даних.

Всі масиви по стадіях Їх створення можна поділити на первинні, основні, робочі та результатні.

Первинні ( вхідні) - це проміжна ланка між вхідними документами та основними масивами. Вони містять образи вхідних документів тому склад і розташування інформації у цих масивах частіше за все аналогічне складу і розташуванню реквізитів у цих документах.

Первинні масиви вміщують зібрану та зареєстровану інформацію. Такі масиви можна поділити на оперативні (умовно-змінні) та нормативно-довідкові (умовно-постійні). Розрізняють Їх по стабільності інформації, яка в них зберігається. У масивах нормативно-довідкової інформації (НДІ) інформація, що зберігається, змінюється рідко і у невеликій кількості. У оперативних масивах інформація змінюється практично повністю по закінченні чергового планового або облікового періоду, або змінюється по мірі виконання нових господарських операцій. Наприклад, НДІ - норми часу на виробництво деталей, оперативна інформація - табель відпрацьованого часу.

Основні масиви створюються на підставі вхідних , постійно зберігаються та містять основні дані про об’єкт управління у процесах виробництва. ( наприклад масиви основних засобів , матеріальних та трудових ресурсів)

Кожен основний масив може формуватися на підставі декількох вхідних масивів, які отримані з різних первинних документів.

Робочі масиви створюються підчас роботи програм , включають обмежене коло реквізитів одного або декількох масивів. Робочі масиви створюються підчас роботи програми у якій вони використовуються , після роботи програми вони знищуються.

Результатні масиви Створюються на підставі основних або робочих. Вони містять інформацію для друку. Результатні масиви створюються автоматично в процесі обробки інформації на ЕОМ

Якщо одна й таж інформація використовується на різних ПК у мережі зберігання інформації може бути з використанням наступних підходів: централізованого, розподіленого, з копіюванням, з дублюванням.

Централізований підхід передбачає зберігання всіх масивів НДІ на спеціальній ЕОМ, яка зветься файл-сервером або сервером баз даних. Звертання до неї можливо із будь-якої ЕОМ мережі. При такому зберіганні інформації всі зміни у масиви вносить адміністратор бази даних на основі повідомлень про зміни. У деяких випадках, коли на кожній ЕОМ мережі працюють дуже кваліфіковані користувачі, можливо внесення змін у масиви НДІ під час діалогу користувача з ЕОМ на основі звичайних документів.

Зберігання з копіюванням передбачає на кожній ЕОМ зберігати однакові копії масивів НДІ. В цьому випадку особливо актуально забезпечити узгодженість даних, що зберігаються. Уявіть ситуацію: є три ЕОМ, на яких обробляється інформація про розрахунки з постачальниками і покупцями. На одній з них, обробляють виписки банка, на іншій відомості про наявність та рух матеріалів на складі, а ще на одній - відомості про рух і наявність готової продукції на складі. На кожній з ЕОМ ведуть довідник партнерів. Якщо кожен бухгалтер на свій розсуд буде вносити зміни у довідник партнерів, то розрахунки з партнерами виконати буде дуже важко. Один і той же партнер на кожній з ЕОМ може бути записаний по-різному і загальні підсумки по розрахунках з ним можна буде визначити тільки після тривалого аналізу і співставлення результатних документів, що друкуються на ЕОМ.

Щоби уникнути такої ситуації необхідно щоб зміни у масив вносив адміністратор бази даних.

При розподіленому зберіганні у кожному місці, де зберігаються масиви НДІ, зберігаються підмножини масивів, які не повторюються. У такій ситуації за коригування кожного масиву відповідає окремий спеціаліст. В його обов'язки входить внесення змін у масив (дивись технологію при централізованому зберіганні) і повідомлення адміністратора бази даних про зміни. Адміністратор вносить зміни у масив-еталон. При такому зберіганні, якщо місць зберігання небагато, то спеціалістом, який відповідає за внесення змін у масив, є адміністратор бази даних. В інших випадках за внесення змін відповідає користувач. Якщо в організації немає адміністратора бази даних, то користувач вносить зміни до масиву

на свій розсуд і сам відповідає за його зберігання.

При зберіганні з дублюванням в кожному місці, де зберігаються масиви, може знаходитись будь-яка підмножина масивів НДІ. Для тих масивів, що зберігаються тільки на одній ЕОМ, коригування виконується користувачем.

База даних –– це пойменована, структурована сукупність логічно взаємопов’язаних даних, які характеризують окрему предметну область і перебувають під управлянням СКБД.

Під предметною областю розуміють один чи кілька об’єктів управління (або певні Їх частини), інформація яких моделюється за допомогою БД і використовується для розв’язання різних функціональних задач.

БД являє собою інтегроване сховище даних, яке використовується багатьма споживачами і забезпечує незалежність даних вад прикладних програм. Зв’язок кінцевих користувачів і прикладних програм з БД відбувається через СКБД, яка виступає інтерфейсом між користувачем і базою даних (рис.1.1). Користувачами БД можуть бути окремі фізичні особи чи прикладні програми.

Фонд даних –– це активні дані, з якими постійно працюють прикладні програми та користувачі, які зберігаються на вінчестері й перебувають безпосередньо під управлінням СКБД.

Архіви –– це архівні копії файлів БД, які зберігаються на стримері, гнучких магнітних дисках, сідеромі чи на вінчестері іншої ЕОМ.

В архівах зберігаються неактивні дані, що вже відпрацювали, але їх необхідно зберігати згідно з нормативними та законодавчими актами досить тривало. Прикладом може бути банківська та деякі види облікової інформації, яка згідно із законодавчими актами має зберігатися кілька років. В архівах також зберігаються страхові копії файлів БД, які використовуються для відновлення БД в разі її руйнування при різних збоях.

Особливістю БД і її відмінною рисою є те, що дані та їх опис зберігаються разом. Опис даних, навіть якщо він зберігається разом із даними, називають метаданими. Іноді опис даних у літературі називається схемою, а та частина баз даних, що використовується якоюсь прикладною програмою, –– підсхемою.

У деяких сучасних системах до метаданих належать не лише описи самих даних, а й інформація про предметну область, користувачів системи, статистику її роботи та інші відомості. Для централізованого зберігання всієї метаінформації використовується словник даних (СД).

Словник даних використовується кінцевими користувачами під час роботи із системою, прикладними програмістами –– при написанні програм, системними програмістами –– в процесі розширення системи.

Проектування машинної ІБ, таким чином, пов'язане з визначенням складу і змісту інформаційних масивів, розробкою способів формування масивів і Їх машинного ведення та ін..

Від того, наскільки успішно буде спроектовано базу даних, залежить ефективність функціонування системи в цілому, її життєздатність і можливість розширення й подальшого розвитку.

Виділять такі рівні подання даних:

зовнішній

інфологічний

даталогічний (логічний)

фізичне

Зовнішній рівень є, як правило, словесним описом вхідних і вихідних повідомлень, а також даних, які доцільно зберігати в БД. Опис зовнішнього рівня не виключає наявності елементів дублювання, надлишковості та неузгодженості даних. Тому для усунення цих аномалій і протиріч зовнішнього опису даних виконується інфологічне проектування. Інфологічна модель є засобом структуризації предметної області й розуміння концепції семантики даних.

Інфологічний рівень являє собою інформаційно-логічну модель (ІЛМ) предметної області, в якій виключено надлишковість даних і відображено інформаційні особливості об’єкта управління без урахування особливостей і специфіки конкретної СКБД..

Логічний (концептуальний) рівень побудований з урахуванням специфіки і особливостей конкретної СКБД. Цей рівень подання даних орієнтований більше на комп’ютерну обробку і на програмістів, які займаються її розробкою. На цьому рівні формується концептуальна модель даних, тобто спеціальним способом структурована модель ПО, яка відповідає особливостям і обмеженням вибраної СКБД. Модель логічного рівня, підтримувану засобами конкретної СКБД, називають іще даталогічною.

Інфологічна та даталогічна моделі, які відображують модель однієї предметної області, залежні між собою. Інфологічна модель має легко трансформуватися в даталогічну модель.

Внутрішній рівень пов’язаний з фізичним розміщенням даних у пам’яті ЕОМ. На цьому рівні формується фізична модель БД, яка вміщує структури зберігання даних у пам’яті ЕОМ, включаючи опис форматів записів, порядок їх логічного або фізичного впорядкування, розміщення за типами пристроїв, а також характеристики і шляхи доступу до даних.

Від параметрів фізичної моделі залежать такі характеристики функціонування БД: обсяг пам’яті й час реакції системи. Фізичні параметри БД можна змінювати в процесі її експлуатації з метою підвищення ефективності функціонування системи. Зміна фізичних параметрів не зумовлює необхідності зміни інфологічної та даталогічної моделей.

Розподілені бази даних

Основна задача систем керування розподіленими базами даних складається в забезпеченні засобу інтеграції локальних баз даних, що розташовуються в деяких вузлах обчислювальної мережі, для того, щоб користувач, що працює в будь-якому вузлі мережі, мав доступ до всіх цих баз даних як до єдиної бази даних.

При цьому повинні забезпечуватися:

  • простота використання системи;
    • можливості автономного функціонування комп’ютерів мережі при порушеннях зв’язку;
    • високий ступінь ефективності.

Різновиди розподілених систем

Можливі однорідні і неоднорідні розподілені бази даних.

В однорідній системі кожна локальна база даних керується однієї і тієї ж СКБД.

У неоднорідній системі локальні бази даних можуть відноситися навіть до різних моделей даних.

Тиражування даних (або реплікація)- це процес формування відтворення багатьох копій даних на одному або декількох вузлах мережі.

Застосування технології тиражування даних надає можливість корпоративним користувачам мати доступ до необхідної Їм поточної інформації з будь-якого місця та у будь-який час.

Використання тиражування даних надає користувачу ряд переваг:

  • Підвищення працездатності у випадку перевантаженості центральних ресурсів;
  • Підвищення ступені "готовності" даних;
  • Зниження навантаження , а також допомога при організації сховищ даних, які призначенні для підтримки прийняття рішень.

Існує два типи тиражування даних:

  • Синхронне
  • Асинхронне

При синхронному тиражування, дані що тиражуються оновлюються одночасно з змінами вихідних даних. Підчас синхронного тиражування синхронізація даних захищається двохфазним протоколом фіксації.

Після того, як сервер здійснить оновлення даних, він відсилає підтвердження до вихідної бази даних та очікує команди до завершення трансакції.

Асинхронне тиражування - це метод у якому цільова база даних модифікується не одночасно з вихідною базою. Затримка в оновленні може бути у діапазоні від декількох секунд до декількох годин, у залежності від конфігурації. Але в результаті дані будуть синхронізовані на всіх вузлах мережі.

При тиражуванні даних використовують наступні моделі тиражування:

  1. Миттєві копії( дані, що використовуються лише для читання) - це найпростіша модель тиражування , при якій таблиця оновлюється в базі даних лише основного вузла, а інші бази даних тиражуються досяжних лише у режимі читання копій.
  2. Миттєві копії, що змінюються - модель тиражування, яка оновлює не тільки таблицю, яка тиражується а й ЇЇ миттєві копії.
  3. Модель тиражування з рівноправними вузлами - це модель, що забезпечує взаємне тиражування таблиць між вузлами розподіленої бази даних.
  4. Гібридна конфігурація - ця модель є комбінацією вище перерахованих моделей, вона забезпечує використання тимчасових копій і вузлів з рівними правами.

З використанням перерахованих моделей будуються наступні схеми тиражування:

  1. Централізована ( або розповсюдження). Під централізованим розповсюдженням мають на увазі середовище де дані оновлюються на центральному вузлі
  2. Консолідація ( або об'єднання)

Консолідація - це тип оновлення, у якому набори даних можуть оновлюватися на регіональних вузлах . а потім тиражуватися на центральний вузол у доступному лише для читання режимі

Цей метод забезпечує визначення належності даних та локальну автономію цих даних на рівні філіалу підприємства.

3.Динамічного права власності на дані ( або належність при розподіленні робочого навантаження)

Така модель дозволяє запобігти конфліктів при оновлені даних і являє собою динамічну техніку оновлення. Належність при розподіленні робочого навантаження дає можливість модифікувати дані, що тиражуються по мірі їх просування від вузла і до вузла. Таким чином , у будь який момент лише один вузол може оновлювати дані.

4.Розподілення права власності (або розподілення робочого навантаження) Ця схема надає адміністраторам бази даних гнучкий спосіб для встановлення належності даних на рівні таблиць розподілення.

Інформаційне сховище - це інтегровані, предметно орієнтовані бази даних, які не руйнуються. Інформаційні сховища виконують функції інформаційних порадників у системах підтримки прийняття рішень.

Дані у інформаційне сховище надходять:

  • з традиційних СКБД,
  • електронних таблиць,
  • текстових редакторів,
  • спеціалізованих пакетів,
  • гіпертекстів

Використовуються

  • виконавчими інформаційними системами ,
  • програмами підтримки прийняття рішень.
  • засобами обробки запитів.

Склад інформаційного сховища являє собою сукупність зовнішньої та внутрішньої інформації з різних джерел.

Сховища призначені для інформаційних цілей, то дані доступні користувачу лише у режимі читання.

Дані у предметно-орієнтованій базі даних повинні зберігатися у вигляді логічних груп, щоб спростити користувачу сприйняття інформації.

Наповнення та обслуговування інформаційних сховищ складається з трьох етапів:

- екстракції,

- трансформації,

- завантаження.

Екстракція даних починається з ідентифікації базової СКБД, у якій зберігаються первинні дані. Потім розробник визначає процедури, які витягають дані з інформаційних підсистем виробничих відділів у інформаційне сховище.

Трансформація даних реалізує три основних алгоритми:

підсумок, консолідацію та корекцію даних.

При завантаженні відбувається синхронізація з датою або якимись зовнішніми подіями. Інформаційне сховище повинно забезпечувати не тільки завантаження даних а також періодичне винищення даних які втратили свою актуальність.

Організація інформаційної бази систем оброблення економічної інформації