Содержание
Введение. 3
1. Сущность и содержание банков данных. 4
2. Базы данных и систем управления базами данных. 7
3. Модели данных и их виды.. 10
Заключение. 15
Список литературы.. 17
Введение
База данных – это организованная структура, предназначенная для хранения информации. В современных базах данных хранятся не только данные, но и информация.
Это утверждение легко пояснить, если, например, рассмотреть базу данных крупного банка. В ней есть все необходимые сведения о клиентах, об их адресах, кредитной истории, состояние расчетных счетов, финансовых операциях и т.д. Доступ к этой базе данных имеется у достаточно большого количества сотрудников банка, но среди них вряд ли найдется такое лицо, которое имеет доступ ко всей базе полностью и при этом способно единолично вносить в нее произвольные изменения. Кроме данных, база содержит методы и средства, позволяющие каждому из сотрудников оперировать только с теми данными, которые входят в его компетенцию. В результате взаимодействия данных, содержащихся в базе, с методами, доступными конкретным сотрудникам, образуется информация, которую они потребляют и на основании которой в пределах собственной компетенции производят ввод и редактирование данных.
С понятием базы данных тесно связано понятие системы управления базой данных. Это комплекс программных средств, предназначенных для создания структуры новой базы, наполнение ее содержимым, редактирование содержимого и визуализации информации. Под визуализацией информации базы понимается отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройства вывода или передачи по каналам связи.
В мире существует множество систем управления базами данных. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий.
Цель работы – раскрыть сущность вопроса, связанного с автоматизированными баками данных.
1. Сущность и содержание банков данных
Термины "банк данных" и "база данных" являются очень близкими синонимами для обозначения некоторого структурированного массива информации. Предполагается, что банки данных содержат информацию, с которой можно производить достаточно ограниченное число манипуляций (поиск, просмотр), в то время как базы данных предоставляют возможность какой-то специальной обработки информации (с помощью специально написанных программ). Тем не менее, для простого пользователя не всегда очевидна закономерность выбора между этими двумя близкими терминами в том или ином случае. Поэтому банки и базы данных можно представлять как суть одно и тоже, с исторически сложившимся отнесением конкретных массивов информации либо к базам, либо к банкам данных.
Компоненты банка данных.
Банк данных (БнД) - это одна из форм информационных систем. Банком данных называют систему специальным образом организованных баз данных, программных, технических, языковых и организационно- методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.
В этом определении обозначены характерные основные черты БнД:
Базы данных создаются обычно для решения не одной, нескольких связанных задач, не одним, а группой пользователей;
В БнД имеются специальные средства, облегчающие для пользователей работу с данными (СУБД).
Централизованное управление данными имеет преимущества по сравнению с обычной файловой системой:
- сокращение избыточности хранения данных;
- сокращение трудоемкости разработки, эксплуатации и модернизации ИС;
-обеспечение удобного доступа к данным как пользователям
- профессионалам в области обработки данных, так и конечным пользователям.
Основные требования, предъявляемые к БнД:
- адекватность отображения предметной области (полнота, целостность и
- непротиворечивость данных, актуальность информации;
- возможность взаимодействия пользователей разных категорий, высокая эффективность доступа к данным;
- дружелюбность интерфейсов, малое время на обучение;
- обеспечение секретности и разграничение доступа к данным для разных пользователей;
- надежность хранения и защита данных.
Ядром БнД является база данных (БД). База данных - это поименованная совокупность взаимосвязанных данных, находящихся под управлением СУБД. Метаинформация включает в себя описание структуры БД (схемы и подсхемы), модель предметной области, информацию о пользователях и их правах, описание формы входных и выходных документов. Централизованное хранилище метаинформации называется словарем данных. Особенно большое значение имеют словари данных в системах автоматизированного проектирования ИС.
Основные задачи, решаемые персоналом банка данных.
В состав персонала БнД входят разные специалисты: администраторы БнД, системные аналитики, системные и прикладные программисты, операторы, специалисты по техническим средствам, по маркетингу и др.
Перечислим основные функции и задачи, решаемые персоналом при разработке и эксплуатации базы данных:
- анализ предметной области (определение потребностей конечных пользователей, построение информационной модели предметной области, выявление ограничений целостности);
- проектирование структуры базы данных (определение состава и структуры файлов БД, описание ее схемы на языке описания данных);
- задание ограничений целостности БД;
- загрузка и ведение БД (к ведению БД относится изменение, удаление и добавление записей); разработка технологии загрузки и ведения; разработка форм ввода данных; ввод и контроль данных;
- защита данных (разграничение пользователей, выбор и проверка средств защиты, фиксация попыток несанкционированного доступа);
- обеспечение восстановления БД;
- анализ эффективности БнД и развитие системы;
- работа с пользователями (сбор откликов, обучение);
- сопровождение системного программного обеспечения (приобретение, установка и развитие);
- организационно-методическая работа (выбор методов проектирования и модернизации, планирование развития БнД, разработка документации).
Классификация банков данных.
Банки данных, как целое, обычно классифицируют по экономико-правовым признакам.
По условиям предоставления услуг различают бесплатные и платные банки, которые, в свою очередь, делятся на коммерческие и бесприбыльные (научные, библиотечные или социально-значимые).
По форме собственности БнД делятся на государственные и негосударственные. По степени доступности различают общедоступные и с ограниченным кругом пользователей.
Другие виды классификации связаны с отдельными компонентами БнД.
Разработка банков данных состоит из 4-х этапов:
1 этап. Формирование и анализ требований к системе:
- составляется спецификация системы, включающая список задач, которые должен решать БнД;
- перечень конечных пользователей и их функций;
- перечень требований к БД;
- составляется схема документооборота в организации.
2 этап. Концептуальное проектирование: создается информационная модель системы без привязки к типу ЭВМ и типу системных программных средств; строится инфологическая модель базы данных, которая наиболее полно описывает предметную область в терминах пользователя.
3 этап. Проектирование реализации: выбирается вычислительная система, системные программные средства и СУБД; проектируется структура данных и строится даталогическая модель БД (схема БД), которая представляет собой описание логической структуры БД на языке конкретной выбранной СУБД.
4 этап. Физическая реализация, которая включает в себя создание и загрузку данных в БД, разработку и отладку прикладных программ для работы с базой данных, написание документации. На этом этапе строится физическая модель БД, которая описывает используемые запоминающие устройства, способы физической организации данных. Описание физической структуры БД называют схемой хранения. В настоящее время наблюдается тенденция к сокращению этого вида работ.
2. Базы данных и систем управления базами данных
Цель любой информационной системы – обработка данных об объектах реального мира. Основные идеи современной информационной технологии базируются на концепции баз данных (БД).
База данных (БД) - это поименованная совокупность структурированных данных, относящихся к определенной предметной области.
Согласно данной концепции основой информационной технологии являются данные, организованные в БД, адекватно отражающие реалии действительности в той или иной предметной области и обеспечивающие пользователя актуальной информацией в соответствующей предметной области. Под предметной областью принято понимать часть реального мира, подлежащего изучению для организации управления и в конечном счёте автоматизации, например, предприятие, ВУЗ и т.д.
Первые БД появились уже на заре 1-го поколения ЭВМ представляя собой отдельные файлы данных или их простые coвокупности.
Создавая базу данных, пользователь стремится упорядочить информацию по различным признакам и быстро извлекать выборку с произвольным сочетанием признаков. Сделать это возможно, только если данные структурированы.
Структурирование - это введение соглашений о способах представления данных.
Неструктурированными называют данные, записанные, например, в текстовом файле.
Пользователями базы данных могут быть различные прикладные программы, программные комплексы, а также специалисты предметной области, выступающие в роли потребителей или источников данных, называемые конечными пользователями.
Структурные элементы базы данных
Понятие базы данных тесно связано с такими понятиями структурных элементов, как поле, запись, файл (таблица).
Поле - элементарная единица логической организации данных, которая соответствует неделимой единице информации - реквизиту. Для описания поля используются следующие характеристики:
- имя, например. Фамилия, Имя, Отчество, Дата рождения;
- тип, например, символьный, числовой, календарный;
- длина, например, 15 байт, причем будет определяться максимально возможным количеством символов;
- точность для числовых данных, например два десятичных знака для отображения дробной части числа.
Запись - совокупность логически связанных полей. Экземпляр записи — отдельная реализация записи, содержащая конкретные значения ее полей.
Файл (таблица) - совокупность экземпляров записей одной структуры.
В структуре записи файла указываются поля, значения которых являются ключами первичными (ПК), которые идентифицируют экземпляр записи, и вторичными (ВК), которые выполняют роль поисковых или группировочных признаков (по значению вторичного ключа можно найти несколько записей).
Системы управления базами данных
По мере увеличения объемов и структурной сложности хранимой информации, а также расширения круга потребителей информации, определилась необходимость создания удобных и эффективных систем интеграции хранимых данных и управления ими. Теперь создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляются централизованно с помощью специального программного инструментария - системы управления базами данных (СУБД).
Система управления базами данных (СУБД) - это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.
Первые СУБД, поддерживающие opганизацию и ведение БД, появились в конце 60-х годов.
Использование СУБД обеспечивает лучшее управление данными, более совершенную организацию файлов и более простое обращение к ним по сравнению с обычными способами хранения информации.
Состав СУБД. Описание БД
Язык описания данных (ЯОД) – Средства описания данных в БД и связей между ними. Средствами этого языка описывается структура БД, форматы записей, пароли, защищающие данные.
Язык манипулирования данными (ЯМД) – язык для выполнения операций над данными, позволяющий менять их строение.
Для различных СУБД реализация этих уровней языков может быть различной. В одних случаях ЯОД и ЯМД требует составления пользователем программы полностью “вручную”, в других (что отражает современную тенденцию) в СУБД присутствует средства визуальной (зримой, наглядной) разработки программ. Для этого в современных СУБД имеются редакторы экранных форм, отчетов. “Кирпичиками” (инструментами) таких редакторов являются поля различных видов (поля ввода, поля вывода, вычисляемые поля), процедуры обработки различных типов (формы ввода, таблицы, отчеты, запросы). На основании созданных пользователем объектов программы – генераторы формируют программный код на языке конкретной машины или на промежуточном языке.
3. Модели данных и их виды
Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.
Модель данных - совокупность структур данных и операций их обработки.
По способу установления связей между данными СУБД основывается на использовании трёх основных видов модели: иерархической, сетевой или реляционной; на комбинации этих моделей или на некотором их подмножестве.
Однако различия между этими моделями постепенно стираются, что обусловлено, прежде всего, интенсивными работами в области баз знаний (БЗ) и объектно-ориентированной инфотехнологией, о которой будет идти речь ниже.
Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений. Одно из основных различий этих моделей состоит в том, что для иерархических и сетевых СУБД их структура часто не может быть изменена после ввода данных, тогда как для реляционных СУБД структура может изменяться в любое время. С другой стороны, для больших БД, структура которых остается длительное время неизменной, и постоянно работающих с ними приложений с интенсивными потоками запросов на БД-обслуживание именно иерархические и сетевые СУБД могут оказаться наиболее эффективными решениями, ибо они могут обеспечивать более быстрый доступ к информации БД, чем реляционные СУБД.
Иерархическая модель данных.
Иерархическая структура представляет совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево).
К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в базе данных определяется числом корневых записей.
К каждой записи базы данных существует только один (иерархический) путь от корневой записи.
Каждому узлу структуры соответствует один сегмент, представляющий собой поименованный линейный кортеж полей данных. Каждому сегменту (кроме S1-корневого) соответствует один входной и несколько выходных сегментов. Каждый сегмент структуры лежит на единственном иерархическом пути, начинающемся от корневого сегмента.
Следует отметить, что в настоящее время не разрабатываются СУБД, поддерживающие на концептуальном уровне только иерархические модели. Как правило, использующие иерархический подход системы, допускают связывание древовидных структур между собой и/или установление связей внутри них. Это приводит к сетевым даталогическим моделям СУБД.
К основным недостаткам иерархических моделей следует отнести: неэффективность реализации отношений типа N:N, медленный доступ к сегментам данных нижних уровней иерархии, четкая ориентация на определенные типы запросов и др. В связи с этими недостатками ранее созданные иерархические СУБД подвергаются существенным модификациям, позволяющим поддерживать более сложные типы структур и, в первую очередь, сетевые и их модификации.
Сетевая модель данных.
В сетевой структуре при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.
Сетевая модель СУБД во многом подобна иерархической: если в иерархической модели для каждого сегмента записи допускается только один входной сегмент при N выходных, то в сетевой модели для сегментов допускается несколько входных сегментов наряду с возможностью наличия сегментов без входов с точки зрения иерархической структуры.
Графическое изображение структуры связей сегментов такого типа моделей представляет собой сеть. Сегменты данных в сетевых БД могут иметь множественные связи с сегментами старшего уровня. При этом направление и характер связи в сетевых БД не являются столь очевидными, как в случае иерархических БД. Поэтому имена и направление связей должны идентифицироваться при описании БД.
Таким образом, под сетевой СУБД понимается система, поддерживающая сетевую организацию: любая запись, называемая записью старшего уровня, может содержать данные, которые относятся к набору других записей, называемых записями подчиненного уровня. Возможно обращение ко всем записям в наборе, начиная с записи старшего уровня. Обращение к набору записей реализуется по указателям.
В рамках сетевых СУБД легко реализуются и иерархические даталогические модели.
Сетевые СУБД поддерживают сложные соотношения между типами данных, что делает их пригодными во многих различных приложениях. Однако пользователи таких СУБД ограничены связями, определенными для них разработчиками БД-приложений.
Более того, подобно иерархическим сетевые СУБД предполагают разработку БД приложений опытными программистами и системными аналитиками.
Среди недостатков сетевых СУБД следует особо выделить проблему обеспечения сохранности информации в БД, решению которой уделяется повышенное внимание при проектировании сетевых БД.
Реляционная модель данных.
Понятие реляционный (англ. relation — отношение) связано с разработками известного американского специалиста в области систем баз данных, сотрудника фирмы IBM д-ра Е. Кодда, которым впервые был применен термин "реляционная модель данных".
В течение долгого времени реляционный подход рассматривался как удобный формальный аппарат анализа баз данных, не имеющий практических перспектив, так как его реализация требовала слишком больших машинных ресурсов. Только с появлением персональных ЭВМ реляционные и близкие к ним системы стали распространяться, практически не оставив места другим моделям.
Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
- каждый элемент таблицы - один элемент данных; повторяющиеся группы отсутствуют;
- все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;
- каждый столбец имеет уникальное имя;
- одинаковые строки в таблице отсутствуют;
- порядок следования строк и столбцов может быть произвольным. Таблица такого рода называется отношением.
База данных, построенная с помощью отношений, называется реляционной базой данных.
Отношения представлены в виде таблиц, строки которых соответствуют кортежам или записям, а столбцы - атрибутам отношений, доменам, полям.
Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом (ключевым полем). Если записи однозначно определяются значениями нескольких полей, то такая таблица базы данных имеет составной ключ.
Чтобы связать две реляционные таблицы, необходимо ключ первой таблицы ввести в состав ключа второй таблицы (возможно совпадение ключей); в противном случае нужно ввести в структуру первой таблицы внешний ключ - ключ второй таблицы.
Предложив реляционную модель данных, Э.Ф.Кодд создал и инструмент для удобной работы с отношениями – реляционную алгебру. Каждая операция этой алгебры использует одну или несколько таблиц (отношений) в качестве ее операндов и продуцирует в результате новую таблицу, т.е. позволяет "разрезать" или "склеивать" таблицы.
Заключение
База данных - физическое пространство (место на внешнем носителе компьютера), на котором в строго определенном порядке записываются и хранятся конкретные значения реквизитов (данные) первичных информационных форм, относящиеся к одному роду объектов учета. Здесь особо следует подчеркнуть однородность каждой базы данных, например, для накопления информации об автотранспорте, похищенных вещах и т. п.
Другое более общее определение определяет базу данных как хранилище данных, предназначенных для совместного использования. Здесь особо выделяется возможность совместного использования информации хранящейся в базе данных многими пользователями одновременно. Многопользовательский режим доступа к данным, хранящимся в базе может быть организован различными способами:
- использование в сети файл-серверов, на которых физически хранятся вся база данных. При такой организации каждый пользователь работает с базой данных так, как будто она размещена на собственном компьютере. Недостатком такой организации многопользовательской БД является большая нагрузка на каналы связи т. к. при обслуживании запроса порции данных считываются с диска центрального компьютера (файл-сервера) небольшими порциями и передаются на рабочее место, где происходит их обработка;
- технология клиент/сервер, при которой вся обработка информации, все транзакции, задаваемые пользователями, выполняется самим сервером, а на рабочие станции передаются только результаты. К пропускной способности каналов связи в этом случае предъявляются значительно меньшие требования, однако центральный компьютер, обслуживающий базу данных, должен быть значительно мощнее, чем в первом варианте. При этом, рабочие станции могут быть бездисковыми терминалами;
- распределенная структура – когда части (фрагменты) одной базы данных физически находятся на различных серверах сети. По такому принципу строятся глобальные информационные системы типа Internet.
Для создания и обслуживания таких систем используется специализированное программное обеспечение - системы управления базами данных СУБД.
К основным функциям СУБД любого типа можно отнести:
- создание (конструирование) базы данных путем описания структуры хранимой информации и взаимосвязей между ее частями;
- занесение, хранение и удаление информации из базы данных - т. е. поддержание БД в актуальном состоянии;
- обслуживание выборок и запросов пользователей.
Список литературы
1. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. - М., Финансы и статистика, 2003.
2. Информатика. Базовый курс./Под ред. С.В. Симоновича. - СПб: Питер, 2004.
3. Информатика./Под ред. В.Г. Кирия. – Иркутск: ИрГТУ, 2003.
4. Информатика./Под ред. В.В. Ломтадзе, Л.П. Шишкина. – М.: ЮНИТИ, 2004.
5. Цикритизис Д., Лоховски Ф. Модели данных. - М., Финансы и статистика, 2004.