Методы и средства обработки данных

1. Информационные системы с низкоуровневым доступом: носитель--двоичные данные--приложение--пользователь

Приложение должно самостоятельно формировать последовательности команд носителя для реализации каждой из процедур обработки данных. Удовлетворяют признаку 1.

2. Файловые информационные системы: носитель--двоичные данные--файловая система--приложение--пользователь.

Удовлетворяют признаку 1, частично 2. Данные представляются на носителе в составе файлов – логических единиц, не требующих при их обработке знания команд носителя и явного указания адресов фрагментов данных на носителе. Файл представляет собой последовательность байтов – минимальных единиц представления информации в оперативной памяти компьютера. Для представления больших структурных единиц данных (имя, дата рождения и др.) так же как и в случае низкоуровневого доступа используются наборы байтов, которые в свою очередь группируются в наборы верхнего уровня (паспортные данные включают имя и дату рождения и, в свою очередь входят в данные о сотруднике некоторого учреждения). Соответствующим образом файл делится на фрагменты байтов, и информация о таком разделении «зашита» внутри приложения. Изменение структуры влечет изменение (переписывание) процедур обработки данных в приложении.

3. Информационные системы с базами данных
а) носитель--двоичные данные--файловая система--СУБД--приложение--пользователь
б) носитель--двоичные данные--СУБД--приложение--пользователь

Удовлетворяют признаку 1-7. Данные представляются в качестве экземпляров (реализаций) некоторых шаблонов (заготовок под хранение данных, описанных в рамках некоторой модели представления данных). Для данных шаблонов указаны правила размещения в них данных (перечень и типы элементов, допустимые значения и т.д.), а также правила связи между элементами шаблонов разного типа. Описания шаблонов хранятся вместе с самими данными (экземплярами шаблонов) в базе данных, в соответствии с чем любое приложение может определить состав хранимой информации. Для управления данными (создания и модификации информации о шаблонах, создания и модификации данных) используются стандартные процедуры и языки манипулирования и описания данных, реализованные в рамках специальных программных систем – систем управления базами данных.

Система управления базой данных (СУБД) – комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

Таким образом, наиболее полно удовлетворяют представлению о «идеальной» информационной системе обработки данных именно системы с базами данных. Далее мы внимательно рассмотрим определение базы данных и познакомимся с наиболее развитым направлением в теории и практике баз данных – реляционными базами данных.

Лекция 3

ПОНЯТИЕ БАЗЫ ДАННЫХ

Что такое база данных? -База данных (БД) - поименованная совокупность структурированных данных, хранимых в памяти вычислительной системы стандартным способом и отображающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.

Рассмотрим подробно данное определение и его элементы:
а) предметная область – фрагмент реального мира, подлежащий автоматизации. Предметная область содержит только те сущности, их взаимосвязи и процессы изменения сущностей и взаимосвязей, которые необходимы для корректной работы рассматриваемой (разрабатываемой) автоматизированной системы. Сущностью или информационным объектом предметной области называется некоторое понятие, общее для ряда объектов реального мира. Сущность описывается набором признаков, важных для рассматриваемой предметной области, состав которых позволяет отделить объекты (экземпляры) одной сущности от объектов (экземпляров) другой сущности предметной области, а значения которых позволяют отличить различные экземпляры одной сущности.

Задача выявления сущностей предметной области и их атрибутов является весьма сложным этапом концептуального проектирования БАЗЫ ДАННЫХ, и в общем случае не имеет однозначного решения. Обычно необходимо выполнить несколько итераций для получения приемлемого решения на текущем этапе проектирования БАЗЫ ДАННЫХ, при этом, возможно, впоследствии возникнет необходимость изменения состава сущностей и их атрибутов. Более подробно методы построения концептуальной модели БАЗЫ ДАННЫХ будут рассмотрены на последующих лекциях.

Так, автоматизированная система контроля успеваемости студентов университета содержит списки студентов и академических групп университета (студент и группа – сущности предметной области), информацию о разбиении студентов по группам (связи сущностей группа и студент), правила определения текущего и итогового рейтинга студентов (процессы).

Сущность «студент» характеризуется следующим набором признаков (атрибутов), важных для предметной области «Контроль успеваемости студентов университета»: Фамилия, имя, отчество, номер зачетной книжки, номер академической группы, текущий рейтинг по каждому из предметов. Номер зачетной книжки (а также имя, фамилия, отчество) позволяют различать студентов как экземпляров сущности «студент». Академическая группа включает набор признаков: наименование группы, наименование факультета. Состав наборов признаков отличают сущности «группа» и «студент».

б) состояние объектов и их взаимосвязей – под состоянием объекта (как экземпляра сущности) подразумевается набор значений признаков, определяющих объект. Значения признаков могут меняться со временем (т. е. меняется состояние объектов). Так у студента может измениться академическая группа (при переходе на следующий курс) и текущий рейтинг. При переходе на следующий курс также меняется и взаимосвязь объектов – академических групп и студента (был связан с одной группой, стал связан с другой).

в) структурированные данные – данные, элементы которых упорядочены в соответствии с некоторыми соглашениями. К каждому элементу структурированных данных можно обратиться непосредованно, используя информацию о структуре. Например, если данные хранятся в таблице, то имя пятого ученика мы можем получить из ячейки, находящейся на пересечении столбца «Имя» и пятой строки таблицы, если данные структурированы с помощью таблицы. Кроме определения правила расположения элементов данных в общем хранилище данных структурирование часто подразумевает определение типа данных – то есть способа их представления и объема требуемой для их хранения памяти. В нашем случае имя может являться строкой из 25 символов.

г) хранимых в памяти вычислительной машины – подразумевается использование вычислительной техники для хранения данных, в отличие от данных, хранимых неавтоматизированно, например библиотечных каталогов.

д) стандартным способом – должно существовать описание правил структурирования данных для того формата, в котором представлена рассматриваемая база данных. В соответствии с этими правилами любое приложение может получить к этим данным доступ независимо от приложения, с помощью которого рассматриваемая база данных была создана.

е) поименованная – совокупность данных должна быть явно определена и фиксирована заданием структуры хранимых данных и имени этой структуры. Каждое приложение работает с определенной базой данных, используя ее имя для доступа к ней.

Лекция 4

Наши рекомендации