Структура и обработка данных

Единицы представления, измерения и
хранения данных

Структура данных

Р

абота с большими наборами данных проще, если они образуют упорядоченную структуру. Существуют три основных типа структур данных: линейная, табличная и иерархическая. Они различаются методом адресации к данным.

Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес каждого элемента однозначно определяется своим номером в списке. Разделителем между элементами списка может быть конец строки, пробел или какой-либо другой специальный символ. Примером линейной структуры данных может служить список студентов в журнале посещаемости занятий. Если все элементы списка имеют одинаковую длину, то разделители вообще не нужны. Такие упрощенные списки называются векторами данных. Работать с ними особенно удобно.

Табличные структуры данных – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая этот элемент. Примером может служить таблица умножения. Если все элементы имеют равную длину, то такие таблицы называются матрицами. В этом случае разделители можно не использовать. Если число измерений в таблице больше двух, то такая таблица называется многомерной. Приведем пример таблицы с размерностью, равной четырем.

Номер факультета:
Номер курса:
Номер группы:
Номер студента в группе:

С помощью такой таблицы может быть организован учет студентов. Для отыскания данных о студенте в подобной структуре надо знать все четыре параметра.

Иерархические структуры данных – это структуры в виде дерева, в котором адрес каждого элемента определяется указанием пути (маршрута), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь к команде, запускающей программу Калькулятор.

Пуск®Все программы®Стандартные®Калькулятор

Файловые структуры данных – это иерархические структуры хранения файлов на диске в специальных областях памяти, называемых каталогами (или папками). В отдельном файле хранятся данные одного типа. Уникальность имени файла обеспечивается тем, что полное имя файла (полный адрес) включает в себя собственное имя файла и путь доступа к нему. Например, следующие два файла имеют одно и то же собственное имя (выделено курсивом), но отличаются полными именами, так как имеют разные пути доступа.

D:\Мои документы\Группа 251\Статистика\Гистограммы.xls

D:\Мои документы\Excel 253\Гистограммы.xls

Обработка данных

О

бработка данных включает в себя множество различных процедур, полный список которых составить практически невозможно. К числу основных можно отнести следующие процедуры.

Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений.

Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить уровень их доступности.

Преобразование данных – перевод данных из одной формы или структуры в другую форму или структуру соответственно. Необходимость преобразования данных, например, возникает при транспортировке цифровых потоков данных по каналам телефонной сети, которые изначально ориентированы на передачу аналоговых сигналов. Для преобразования цифровых данных в аналоговые сигналы используются специальные устройства – модемы.

Фильтрация данных – отсеивание «лишних» данных. При этом уменьшается «уровень шума», а достоверность и адекватность данных возрастает.

Сортировка данных – упорядочение данных с целью повышения доступности информации.

Архивация данных – специальная организация хранения данных. Служит для снижения затрат на хранение данных и повышает надежность информационного процесса.

Защита данных – комплекс мер, предназначенных на предотвращение потери данных, их воспроизведения и модификации.

Транспортировка данных – прием и передача данных между удаленными участниками информационного процесса. При этом источник данных в информатике принято называть сервером, а потребителя – клиентом.

Задачи по обработке данных предполагают способы описания процесса обработки. Процедуры обработки представляются как на внешнем уровне в виде алгоритма, так и на внутреннем в виде программы, которая кодируется средствами машинного языка.

Единицы представления, измерения и
хранения данных

С

пособы представления данных зависят от того, для кого эти данные предназначены: для человека (внешнее представление) или для ЭВМ (внутреннее представление). Во внешнем представлении все данные хранятся в виде файлов. Более высоким уровнем организации данных на внешнем уровне являются базы данных. Для внутреннего представления данных разных типов используется универсальная система двоичного кодирования. Исходя из этого, приняты следующие единицы представления, измерения и хранения данных.

Единицы представления данных. Минимальной единицей представления данных в вычислительной технике считается бит. Более крупной единицей является совокупность из восьми битов, которая называется байтом. Во многих случаях целесообразно не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более.

Слово – группа из двух взаимосвязанных байтов (16 разрядов).

Удвоенное слово – группа из четырех взаимосвязанных байтов (32 разряда).

Учетверенное слово – группа из восьми взаимосвязанных байтов (64 разряда).

Пока, на сегодняшний день такой системы обозначений достаточно.

Единицы измерения данных. Наименьшей единицей измерения данных принят байт. 1 байт состоит из 8 бит
(23 бит). Более крупные единицы измерения образуются добавлением префиксов кило-, мега-, гига-, тера-.

1 Кбайт = 1024 байт (210 байт=213бит);

1 Мбайт = 1024 Кбайт (220 байт=223бит);

1 Гбайт = 1024 Мбайт (230 байт=233бит);

1 Тбайт = 1024 Гбайт (240 байт=243бит).

В килобайтах измеряются относительно небольшие объемы данных. Условно можно считать, что если на одной странице машинописного текста помещается в среднем 2500 знаков (около 2 Кбайт), то 1 Мбайт – это примерно 400 страниц, а 1 Гбайт – 400 тысяч страниц.

Единицы хранения данных. При хранении данных в компьютере решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ. В настоящее время в качестве единицы хранения данных принят файл. Все данные на компьютере записываются в виде файлов или наборов файлов.

Файл — это объект переменной длины, хранящийся на машинном носителе (магнитные или оптические диски) и обладающий уникальным именем. Файл представляет собой последовательность произвольного числа байтов. В отдельном файле хранятся однотипные данные. В определении файла особое внимание уделяется имени, так как в полном имени файла указаны адресные данные (путь), обеспечивающие доступ к файлу, и задан тип данных.

структура и обработка данных - student2.ru

Тесты

№ п/п Вопрос Варианты ответов
Для хранения в оперативной памяти символы преобразуются в … 1. Числовые коды в двоичной системе счисления. 2. Графические образы. 3. Числовые коды в десятичной системе счисления. 4. Числовые коды в шестнадцатиричной системе счисления.
Форма, в которой данные хранятся, обрабатываются и передаются, называется ____________ данных. 1. Кодированием. 2. Накоплением. 3. Представлением. 4. Преобразованием.
К операциям с данными не относится 1. Формализация. 2. Локализация. 3. Архивация. 4. Сортировка. 5. Транспортировка.
Бит — это… 1. Состояние диода: закрыт или открыт. 2. 8 байт. 3. Запись текста в двоичной системе. 4. Наименьшая возможная единица информации.
Байт – это… 1. Закодированное слово. 2. Запись текста в двоичной системе. 3. 2 бита. 4. Наименьшая единица измерения в информатике. 5. Элементарная единица представления данных в двоичном коде.
В одном байте содержится… 1. 8 бит. 2. 10 бит. 3. 16 бит. 4. 32 бита. 5. 64 бита.
Имеется сообщение объемом 223 бит. В мегабайтах объем этого сообщения равен … 1. 64 2. 8 3. 1 4. 1024
1 гигабайт содержит ________ байт. 1. 220 2. 103 3. 230 4. 1 000 000
Выберите вариант, в котором объемы памяти расположены в порядке возрастания 1. 15 бит, 20 бит, 2 байта, 1 Кбайт, 1010 байт 2. 15 бит, 20 бит, 2 байта, 1010 байт, 1 Кбайт 3. 15 бит, 2 байта, 20 бит, 1010 байт, 1 Кбайт 4. 15 бит, 2 байта, 20 бит, 1 Кбайт, 1010 байт
Расположите единицы измерения данных в порядке возрастания. А. Гигабайт. Б. Мегабит. В. Мегабайт. Г. Терабайт.

Введите в таблицу выбранные буквы.

       

Наши рекомендации