Концепция администратора БД.
Администратор БД – это лицо или группа лиц, на которых возложена ответственность за управления средствами БД организации. Администратор отвечает за проектирование базы, её внедрение, обновление, если необходимо – за реорганизацию, а также за анализ потребностей пользователей, их консультацию и общение.
Положительные стороны БД:
- обеспечение целостности и секретности данных;
- данные могут использоваться для решения многих задач;
- данные обладают регулируемой избыточностью;
- данные могут накапливаться в соответствии с единой идеологией;
- информация предоставляется пользователю в виде, наиболее полно поддерживающем принятия необходимого решения.
Реализация перечисленных концепций невозможна без специального комплекса программ, на который возложена функция управления всеми действиями, производимыми над базами данных. Система управления базами данных (СУБД) – это программная система, предназначенная для обслуживания и создания БД, т.е. поддержания БД в актуальном состоянии и обеспечения эффективного доступа пользователей к данным в рамках их полномочий.
Модели данных. Главное отличие данных, хранящихся в БД от прочих данных – их структурированность. В обычном тексте или текстовом файле может храниться определённая информация, но она там не структурирована. Например, имеется фрагмент данных: личное дело № 1684710 Сергеева Петра Михайловича, рождённого 01.01.1975 г., проживающего по адресу г. Одесса ул. Малая Арнаутовская д.15 кв. 6. Приведем их к структурированному виду:
№ л/д | Ф.И.О. | Дата рождения | Адрес | |||||
Фамилия | Имя | Отчество | Город | Улица | Дом | Кв. | ||
Сергеев | Пётр | Михайлович | 01.01.1975 | Одесса | М. Арнаутовская | |||
Компьютеру с такими данными работать намного удобнее, также удобно хранить, корректировать и т.д.
Сведения о члене организации
Ф. И. О. Адрес
№ л/дДата
рождения
ФамилияОтчествоГородКвартира
ИмяУлицаДом
Пример иерархической структуры записи
Поле – минимальный элемент данных. В данном случае поле – это клетка таблицы. Запись – полный набор данных об определенном объекте – строка таблицы. В данном примере запись имеет иерархическую структуру, т.е. имеет вид дерева (см. рис).
Подчёркнутое – поля, которые надлежит заполнить данными.
Моделью какого-либо объекта называется его некоторое, обычно – упрощенное, описание. Такое описание, как правило, подчинено какой-то определенной цели и представляет собой точку зрения на объект какого-то определенного лица.
Моделью данных принято называть описание структуры базы данных с точки зрения конечного пользователя. В этой модели описываются элементы, из которых состоят данные, способ объединения элементов в записи и способы организации связей между записями. В настоящее время приняты три модели данных: иерархическая, сетевая и реляционная.
В иерархической модели структура набора данных имеет вид дерева. Иными словами, набор данных неоднороден, между ними существует отношение подчинения или вложенности. Такую структуру имеют, например, объекты файловой системы в ОС Windows. Чтобы найти нужный файл необходимо знать папку, в которую он вложен. Эта папка также может находиться внутри папки более высокого уровня, и т.д. Таким образом, для получения доступа к нужному файлу надо знать имена всех его вышестоящих объектов.
Представление иерархической структуры папок программой FAR manager | Представление иерархической структуры папок программой Проводник |
Иерархическая структура объектов файловой системы ОС Windows
Примерно также организованы записи в иерархической базе данных. Связь существует только между записями и объектами, находящимися выше их по иерархии, а записи, находящиеся на одном иерархическом уровне между собой не связаны.
Основное достоинство иерархических БД заключается в простоте и высокой скорости поиска нужной информации (при условии, что известны имена всех вышестоящих узлов нужной записи). Эффективность поиска в информационных иерархических структурах столь высока, что их широко использовали еще в докомпьютерную эпоху для создания каталогов и картотек. Пример такой «базы данных» описан в сказке Н. Носова «Незнайка на Луне». В полицейском участке лунного города картотека данных обо всех преступных элементах хранится в трех шкафах. В первом шкафу – данные о преступниках высокого роста, во втором – среднего, в третьем – низкого. В каждом шкафу три полки. На верхних полках – данные о преступниках с головой большого размера, на вторых полках – о преступниках со средним размером головы, на нижних – о преступниках с маленькими головами. Наконец, на каждой полке три ящика, в которых преступники классифицируются по размерам носов – большие, средние, маленькие. Согласно этой классификации Незнайку отнесли к группе среднего роста, с большой головой и маленьким носом.
В сетевой модели структура набора данных имеет вид произвольного графа. В БД этого вида разрешены связи типа «многие со многими». Например, для повышения эффективности поиска в описанной выше «лунной» картотеке можно было бы ввести кроме деления по антропологическим признакам и другие классификации – например, по преступной специализации (карманники, взломщики, мошенники), по районам преимущественной преступной деятельности и пр. Для хранения такой информации без компьютера пришлось бы для каждого способа классификации приобретать новую группу шкафов, т.к. реализовать такую сложную систему связей в одной картотеке невозможно. При использовании же компьютера подобную структуру можно организовать в одной БД сетевого типа.
Несмотря на очевидные преимущества, иерархические и сетевые модели в настоящее время не столь популярны, как реляционные(от англ. Relation – отношение). В этих БД массивы данных имеют структуру прямоугольной таблицы. Строки в ней соответствуют записям, а столбцы – элементам (полям) записи. Каждая таблица должна удовлетворять следующим требованиям:
- каждый столбец однороден, т.е. его элементы однотипны;
- каждый столбец имеет свое уникальное имя;
- в таблице нет одинаковых строк;
- порядок следования строк и столбцов произволен;
- для однозначной идентификации записи в таблице выделяется ключ – одно или несколько полей, содержащих информацию, однозначно определяющую данную запись; например, для записей о студентах института – это номер зачетки.
Связь между различными таблицами организована через общие поля. Например, в БД приемной комиссии ВУЗа имеется файл с личными делами абитуриентов, ключом является номер экзаменационного листа. Во втором файле содержатся результаты вступительного экзамена, например, по математике. В этом файле также каждая запись содержит поле с номером экзаменационного листа сдававшего абитуриента. Теперь, для автоматического проставления оценок в файл с личными делами, специальная программа СУБД просматривает оба файла, находит в них записи с совпадающими ключами, и переносит данные из файла с оценками в файл с личными делами.
Достоинствами реляционной модели данных являются:
- простота структуры данных, хорошо приспособленной к графическому пользовательскому интерфейсу;
- для разработки эффективных процедур создания наборов данных и манипуляций с ними в настоящее время имеется развитый формальный аппарат реляционной алгебры – раздела математики, посвященного операциям с отношениями; иными словами, существует математическая теория реляционных БД.
Основы СУБД – технологий
СУБД-технологии – основные приемы работы с БД в рамках СУБД.
1-й этап СУБД-технологии – создание структуры записи. Для этого используется специальный язык описания структуры записи. В приведенном выше примере о личном деле Сергеева Петра Михайловича запись имеет иерархическую структуру:
2-й этап – ввод и редактирование данных. После описания структуры записи мы будем иметь незаполненную БД. При её ручном заполнении на экране в соответствии с созданной структурой отображается экранная форма, имитирующая бланк записи. Пользователь заполняет поля этой формы. После заполнения всех полей, запись отправляется из буфера в файл и т.д., пока не запишутся все сведения. В программном режиме заполнения базы эту работу выполняет программа, выбирая информацию из уже существующих файлов, переписывая её в создаваемый файл.
3-й этап – обработка данных. Обработка может происходить в диалоговом режиме с помощью специальных запросов или в процессе выполнения специально созданной программы.
Существуют два вида запросов:
1. Запрос - выборка. При этом происходит отбор нужных данных без их изменения.
2. Запрос - изменение. Это изменение или перемещение отобранных данных.
4-й этап – вывод информации на экран или принтер.Существует два вида вывода информации.
1) Черновой вывод – в необработанном виде, так же, как информация хранится в файле. Например: запись о личном деле в черновом виде выведется так: 1684710 Сергеев Пётр Михайлович 01.01.1975 Одесса Малая Арнаутовская 15 6.
2) Чистовой вывод в форме отчётов. При этом используется специальные средства генерации отчётов, которые позволяют создать законченный документ. Например: приказ ректора об отчислении студентов, с указанием фамилии студентов и с мотивировкой (за что отчислить и на основании какого положения Устава высшей школы), который осталось только подписать.
Информационно-поисковые системы (ИПС). Для менее сложных применений вместо СУБД используются информационно-поисковые системы (ИПС), которые выполняют следующие функции:
· хранение большого объема информации;
· быстрый поиск требуемой информации;
· добавление, удаление и изменение хранимой информации;
· вывод ее в удобном для пользователя виде.
Иными словами, ИПС не предполагают выполнения сложных манипуляций с данными, связанных с их анализом или обработкой.
Тема 6.Компьютерные сети
Создание компьютерных сетей вызвано практической потребностью совместного использования информации лицами и организациями, находящимися друг от друга на значительном удалении. Сети предоставляют пользователям возможность не только быстрого обмена информацией, но и совместного использования периферийных устройств и даже одновременной работы с документами.