Единицы представления, измерения и хранения данных. абота с большими наборами данных проще, если они образуют упорядоченную структуру
Структура данных
Р |
абота с большими наборами данных проще, если они образуют упорядоченную структуру. Существуют три основных типа структур данных: линейная, табличная и иерархическая. Они различаются методом адресации к данным.
Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес каждого элемента однозначно определяется своим номером в списке. Разделителем между элементами списка может быть конец строки, пробел или какой-либо другой специальный символ. Примером линейной структуры данных может служить список студентов в журнале посещаемости занятий. Если все элементы списка имеют одинаковую длину, то разделители вообще не нужны. Такие упрощенные списки называются векторами данных. Работать с ними особенно удобно.
Табличные структуры данных – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая этот элемент. Примером может служить таблица умножения. Если все элементы имеют равную длину, то такие таблицы называются матрицами. В этом случае разделители можно не использовать. Если число измерений в таблице больше двух, то такая таблица называется многомерной. Приведем пример таблицы с размерностью, равной четырем.
Номер факультета: | |
Номер курса: | |
Номер группы: | |
Номер студента в группе: |
С помощью такой таблицы может быть организован учет студентов. Для отыскания данных о студенте в подобной структуре надо знать все четыре параметра.
Иерархические структуры данных – это структуры в виде дерева, в котором адрес каждого элемента определяется указанием пути (маршрута), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь к команде, запускающей программу Калькулятор.
Пуск®Все программы®Стандартные®Калькулятор
Файловые структуры данных – это иерархические структуры хранения файлов на диске в специальных областях памяти, называемых каталогами (или папками). В отдельном файле хранятся данные одного типа. Уникальность имени файла обеспечивается тем, что полное имя файла (полный адрес) включает в себя собственное имя файла и путь доступа к нему. Например, следующие два файла имеют одно и то же собственное имя (выделено курсивом), но отличаются полными именами, так как имеют разные пути доступа.
D:\Мои документы\Группа 251\Статистика\Гистограммы.xls
D:\Мои документы\Excel 253\Гистограммы.xls
Обработка данных
О |
бработка данных включает в себя множество различных процедур, полный список которых составить практически невозможно. К числу основных можно отнести следующие процедуры.
Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений.
Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить уровень их доступности.
Преобразование данных – перевод данных из одной формы или структуры в другую форму или структуру соответственно. Необходимость преобразования данных, например, возникает при транспортировке цифровых потоков данных по каналам телефонной сети, которые изначально ориентированы на передачу аналоговых сигналов. Для преобразования цифровых данных в аналоговые сигналы используются специальные устройства – модемы.
Фильтрация данных – отсеивание «лишних» данных. При этом уменьшается «уровень шума», а достоверность и адекватность данных возрастает.
Сортировка данных – упорядочение данных с целью повышения доступности информации.
Архивация данных – специальная организация хранения данных. Служит для снижения затрат на хранение данных и повышает надежность информационного процесса.
Защита данных – комплекс мер, предназначенных на предотвращение потери данных, их воспроизведения и модификации.
Транспортировка данных – прием и передача данных между удаленными участниками информационного процесса. При этом источник данных в информатике принято называть сервером, а потребителя – клиентом.
Задачи по обработке данных предполагают способы описания процесса обработки. Процедуры обработки представляются как на внешнем уровне в виде алгоритма, так и на внутреннем в виде программы, которая кодируется средствами машинного языка.