Тема 1. Введение в СУБД
Во всех областях человеческой деятельности используется такое понятие как информация, так как любая взаимосвязь и координация работ возможны только благодаря информации. Человек создал естественные информационные системы, поскольку существовала насущная потребность снабжать производство информацией, необходимой при контроле и принятии решений, научился собирать эту информацию, обрабатывать и передавать её по назначению. Тем более, что в условиях рыночной экономики информация выступает как один из важнейших товаров.
Под информацией понимают любые сведения о каком-либо событии, сущности, процессе, являющиеся объектом таких операций, как: восприятие, передача, преобразование, хранение и использование.
Проблеме создания различных средств и методов обработки информации всегда уделялось большое внимание. Но качественный скачок в обработке информации произошел в конце 40-х годов в результате изобретения электронных вычислительных машин (ЭВМ) – компьютеров. Сейчас в некоторых развитых странах в сфере компьютерной обработки информации занято около половины трудоспособного населения, а вложенные сюда средства дают самую высокую прибыль. Компьютерная обработка информации лежит в основе новых информационных технологий (НИТ), массовое и эффективное применение которых определяет прогресс любого общества во всех областях деятельности человека.
Специальные программные системы, ориентированные на выполнение определенного типа обработки информации относятся к прикладным программам. С их помощью реализуются информационные технологии, базирующиеся на компьютерной обработке информации (компьютерные технологии).
В 60-е годы появился новый подход к организации процессов переработки информации, который основывается на понятии систем баз данных (СБД). Базой данных (БД) называют специальным образом организованные данные, хранимые в вычислительной системе (ВС). База данных создается для определенной предметной области (банк, биржа, магазин, склад, библиотека и т.д.). Сегодня базы данных можно встретить практически везде. Их используют в медицине, на транспорте, в правоохранительных органах, в городских справочных службах, на производстве и в учебных заведениях. Базы данных могут содержать в себе различную информацию, получить которую можно в считанные секунды, нажав для этого всего лишь несколько клавиш на клавиатуре компьютера.
Для создания и использования БД служат системы управления базами данных (СУБД), которые занимают особую позицию в мире программного обеспечения и нашей повседневной жизни. Системы управления базами данных обеспечивают реализацию новых концепций в организации информационных служб через создание информационных систем на основе технологии баз данных. В настоящее время широко применяются муниципальные, банковские, биржевые информационные системы, информационные системы оптовой и розничной торговли, торговых домов, служб управления трудом и занятостью, базы данных рынка товаров и услуг, справочной и аналитико-прогнозной котировочной информации и др. Как правило, работа этих систем осуществляется в локальных вычислительных сетях различной архитектуры или их объединениях, получивших название корпоративных сетей, дальнейшая интеграция которых возможна с помощью глобальной сети Интернет.
Грамотная организация информационно-вычислительной системы, в том числе и с использованием Интернет, позволяет не только экономить труд и время специалистов, но вместе с тем увеличивать творческую долю труда работников различных категорий, использующих данную систему в своей работе. Другими словами, использование такой системы, в первую очередь, увеличивает качество труда, а в некоторых случаях позволяет добиться прямого экономического эффекта. Технология систем баз данных позволяет с наименьшими затратами и наибольшей эффективностью организовать информационную систему для решения пользовательских задач и является одной из перспективных технологий обработки данных.
Данные – это информация, зафиксированная в определённой форме, пригодной для последующей обработки, хранения и передачи. Данные соответствуют зарегистрированным фактам об объектах или явлениях реального мира.
В традиционной технологии обработки данных каждая программа работает со своими файлами данных, что приводит к дублированию данных. Попытки избежать дублирования данных за счет использования одних и тех же файлов данных в различных программах приводят к зависимости программ друг от друга. Дело в том, что в системах традиционной обработки данных форматы хранимых данных и структура файла данных определяются программой его создающей, и должны учитываться в программах, использующих этот файл. Изменения в структуре файла данных приводят к изменениям в использующих его программах.
Чтобы избежать дублирования данных и зависимости между данными и программами необходимо иметь файлы данных, создание и изменение структуры которых не определяется программой какого-либо конкретного пользователя. Совокупность таких файлов стали называть базой данных. Программные системы, которые были созданы для разработки и управления базами данных получили название систем управления базами данных.
База данных (БД) — это специальным образом организованные массивы данных, хранящиеся в вычислительной системе и независимые от использующих их программ (именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области). Под предметной областью (ПО) понимается часть реального мира, интересующая пользователя, – это область применения конкретной БД. Различают БД, применяемые в сфере управления предприятиями и организациями, транспортом, в медицине, научных исследованиях и т.д.
Система управления базами данных (СУБД) — совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
Система баз данных (СБД) – это система специальным образом организованных данных – баз данных, программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.
История развития СУБД насчитывает более 40 лет. В 1968 году была введена в эксплуатацию первая промышленная СУБД система IMS фирмы IBM. В 1975 году появился первый стандарт ассоциации по языкам систем обработки данных — Conference of Data System Languages (CODASYL), который определил ряд фундаментальных понятий в теории систем баз данных, которые и до сих пор являются основополагающими для сетевой модели данных.
В дальнейшее развитие теории баз данных большой вклад был сделан америleograp математиком Э. Ф. Коддом, который является создателем реляционной модели данных. В 1981 году Э. Ф. Кодд получил за создание реляционной модели и реляционной алгебры престижную премию Тьюринга Американской ассоциации по вычислительной технике.
Первый этап развития СУБД связан с организацией баз данных на больших машинах типа IBM 360/370, ЕС-ЭВМ и мини-ЭВМ типа PDP11 (фирмы Digital Equipment Corporation — DEC), разных моделях HP (фирмы Hewlett Packard).
Базы данных хранились во внешней памяти центральной ЭВМ, пользователями этих баз данных были задачи, запускаемые в основном в пакетном режиме.
Все СУБД базируются на мощных мультипрограммных операционных системах (MVS, SVM, RTE, OSRV, RSX, UNIX), поэтому в основном поддерживается работа с централизованной базой данных в режиме распределенного доступа.
Функции управления распределением ресурсов в основном осуществляются операционной системой (ОС). Поддерживаются языки низкого уровня манипулирования данными, ориентированные на навигационные методы доступа к данным. Значительная роль отводится администрированию данных.
С появлением персональных компьютеров связан следующий этап развития баз данных. Особенности этого этапа следующие.
Все СУБД были рассчитаны на создание БД в основном с монопольным доступом.
Большинство СУБД имели развитый и удобный пользовательский интерфейс. В большинстве существовал интерактивный режим работы с БД, как в рамках описания БД, так и в рамках проектирования запросов. Кроме того, большинство СУБД предлагали развитый и удобный инструментарий для разработки готовых приложений без программирования. Во всех настольных СУБД поддерживался только внешний уровень представления реляционной модели, то есть только внешний табличный вид структур данных.
При наличии высокоуровневых языков манипулирования данными типа реляционной алгебры и SQL в настольных СУБД поддерживались низкоуровневые языки манипулирования данными на уровне отдельных строк таблиц.
Наличие монопольного режима работы фактически привело к вырождению функций администрирования БД и в связи с этим – к отсутствию инструментальных средств администрирования БД.
И, наконец, последняя и в настоящий момент весьма положительная особенность – это сравнительно скромные требования к аппаратному обеспечению со стороны настольных СУБД.
Следующий этап развития баз данных – это распределенные базы данных и клиент-серверная архитектура.
Практически все современные СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД, и средства экспорта данных из форматов настольных СУБД.
Прикладные программы (ПП) пользователей обращаются к СУБД на логическом уровне без учета того, как данные хранятся в БД. СУБД по запросу пользователя определяет необходимые физические файлы, посредством обращения к описанию отображения данных, и порядок доступа к ним. После чтения данных информация приводится к необходимому прикладной программе виду.
От других способов организации данных СБД отличает ряд существенных преимуществ, таких как:
- значительное сокращение избыточности информации;
- независимость данных от программ и программ от данных;
- качественное управление данными;
- обеспечение контроля на целостность и непротиворечивость данных;
- уменьшение затрат на хранение и обработку данных.
Технология баз данных имеет не только достоинства. Каждое обращение к БД осуществляется при помощи описания отображения данных, что определяет достоинства и недостатки этой технологии:
- увеличение доли служебной информации в общем объеме хранимых данных;
- повышенные требования к техническим и программным средствам системы, так как часть ресурсов расходуется на нужды самой системы;
- потеря эффективности отдельных приложений;
- последствия сбоев труднее исправлять по сравнению с традиционной технологией обработки данных.
Организация хранения и обработки данных – важнейший вопрос, стоящий перед разработчиками информационных систем. При разработке и эксплуатации систем, основанных на технологии баз данных, необходимо учитывать ряд требований, которым они должны удовлетворять:
- адекватность отображения предметной области;
- организация взаимодействия с системой пользователей разного уровня и в различных режимах;
- обеспечение секретности, надёжности и достоверности данных;
- независимость данных от программ их использующих и программ от данных;
-обеспечение приемлемых характеристик функционирования (время реализации запроса, требуемый объём памяти, сервис, стоимость системы и т.д.).
Основная литература: 1[3:7], 2[4:5], 4[3:5].
Дополнительная литература: 9[13:28], 10[35:44].
Контрольные вопросы
1. Дайте определение понятия информации.
2. Дайте определение понятия данных.
3. Дайте определение базы данных.
4. Дайте определение СУБД.
5. Дайте определение СБД.