Типы данных в Информационных Системах (ИС).
Типы данных в ИС могут быть разными.
1) Текстовое данное. Значение каждого текстового (символьного) данного представлено совокупностью произвольных алфавитно-цифровых символов, длина которой не превышает 255 (например, 5, 40, 140). Текстовыми данными в ИС представляют: а) фамилии и должности людей, названия фирм, продуктов; б) данные состоящие из совокупностей текста и чисел, например, адрес; в) числа не требующие вычислении, например, номер телефона, инвентарный номер, почтовый индекс. Поэтому для текстового поля обязательно нужно указать минимально достаточное число знаков: 1 или 2, или 3, ..., или 20, ..., или 40, ... итд до 255. В частном случае, значение текстового данного может быть именем файла, который содержит неструктурированную информацию. Фактически это, структурированная ссылка, позволяющая резко расширить информативность таблицы.
2) Данное типа МЕМО вводится в виде длинный текст или числа, например, примечания или описания: длиной до 64 000 символов
3) Числовое данное. Данного этого типа обычно используются для представления атрибутов, со значениями которых можно производить арифметические операции. Числовое данное, как правило, имеет дополнительные характеристики, например: целое число длиной 2 байта, число с плавающей точкой (4 байта) в фиксированном формате и др.
- байт (информационный объем 1 байт) – допускает ввод чисел от 0 до 255;
- целое (инф. объем до 2 байта) - допускает ввод чисел от -32768 до 32767;
- длинное целое (инф. объем до 4 байта) - допускает ввод чисел от -2147483648 до 2147483647;
- одинарное с плавающей точкой (инф. объем до 4 байта) – десятичное число простой точности от -3,402823Е-38 до 3,402823Е38, т.е. число мантисса которого содержит не более семи цифр затем ставится знак Е и целое число, представляющее степень десяти;
- двойное с плавающей точкой (инф. объем до 8 байта) – десятичное число двойной точности от -1,79769313486231Е-308 до 1,79769313486231Е-308, т.е. число мантисса которого содержит не более пятнадцати цифр затем ставится знак Е и целое число, представляющее степень десяти.
- код репликации) – допускает ввод чисел с информационным объемом до 16 байт;
- действительное – значения данных не должны быть мнимыми.
4) Данное типа даты или времени. Данное типа даты задается в известном машине формате, например, ДД.ММ.ТТТТ (день, месяц, год). Казалось бы, что данное типа дата – это частный случай текстового данного. Использование в ИС особого типа для даты имеет свои следующие преимущества:
ü Система получает возможность вести жесткий контроль, например, значение месяца может быть дискретным в диапазоне 01-12.
ü Появляется возможность автоматизированного представления формата даты в зависимости от традиции той или иной страны.
ü Резко упрощаются арифметические операции с датами.
Данные типа дата или время указываются в виде:
- полный формат даты: формат записи, например, 19.06.2012 17:34:23;
- длинный формат даты: формат записи, например, 19 июня 2012 г.;
- средний формат даты: формат записи, например, 19-июн-2012;
- краткий формат даты: формат записи, например, 19.06.2012;
- полный формат даты: формат записи, например, 17:34:23;
- средний формат даты: формат записи, например, 5:34;
- краткий формат даты): формат записи, например, 17:34.
5)За “Денежный” тип данныхпринимаются заранее установленные виды денежных единиц. В значении денежных данных в целой части используются до 15-ти цифр, ав дробной части до 4-ех цифр, что дает возможность избежать округлении данных при вычислении. За свойства денежного типа данных принимаются:
- Основной – действительное число в виде десятичной дроби;
- Денежный – число в виде десятичной дроби с заранее договоренной денежной единицей;
- Евро – число в виде десятичной дроби с денежной единицей евро;
- Фиксированный – число в виде десятичной дроби с последовательной записью цифр;
- С разделителями разрядов – число в виде десятичной дроби, где число от запятой в лево разделены по три цифры;
- Процентный – десятичная дробь в процентном виде;
- Экспоненциальный – число целая часть которого состоит из одной цифры и после мантиссы числа указывается знак Е затем число соответствующее степени числа 10.
6)В свойствах данных типа Счетчикуказываются
- Длинное целое – может быть числом от 1 до 2 147 483 647 увеличивающееся на 1, обычно используется для вывода порядкового номера;
- Код репликации – используется для ввода чисел с информационным объемом до 16 байт.
7) Логические данные. Данные этого типа может принимать одно из двух взаимоисключающих значений – «Да» или «Нет» или как «Истина» или «Ложь». Поэтому логический тип удобно использовать для тех атрибутов, которые могут принимать одно из двух взаимоисключающих значений, например, наличие водительских прав (да - нет).
8) Объект ОLE. «Значением» такого данного может быть любой объект ОLE (графика, звук, видео). Объектам OLEможно отнести объекты, поддерживающие OLE протокол и подготовленные другими приложениями среды Windows, например, документ Microsoft Word, электронная таблица Microsoft Excel, рисунки, звуки и другие объекты с информационными объемами не превышающие 1 гигабайт.
9) “Гиперссылка” такого типа данные представляют путь к быстрому просмотру нужного внешнего документа.
10) Данные типа Вложениедает возможность внедрить подготовленные другими программами данные: рисунки, изображения, двоичные файлы, файлы Office, но им никакими путями нельзя ввести текстовые или цифровые данные.
11) Мастер подстановокне является типом данных. Он используется для ввода двух типов списка: список данных и поля замены.
Каждый тип данных характеризуется определенными свойствами, которые указываются в полях:
· «Размер поля» - для «Текстовой», «Числовой» или «Счетчик» типа данных нужно указать максимальное, но минимально достаточное значение данных;
· «Формат поля» -желательно указать «по умолчанию», но для данных типа дата/время нужно указать соответствующий формат.
· «Число десятичных знаков» - следует указать количество знаков в дробной части числа.
· «Маска ввода» -указывается знаки, которые помогают при вводе данных.
· «Подпись» - вводится текст, который автоматический появляется форме, отчета и запросе.
· «Значение по умолчанию» -указанное здесь значение автоматически появляется в поле при добавлении новой записи.
· В качестве значения свойства «Условие на значение» нужно указать правило верификации. Правило верификации это условие, которому должен удовлетворять значение данного поля, т.е. логическое выражение которое должно принимать значение «Истина» при вводе данного в это поле, например: >=1 And <=12, система признает ошибочным ввод в это поле любого значения менее 1 и более 12.
· «Сообщение об ошибке» - вводится сообщение, которое должно отображаться, если значение не соответствует выражению в свойстве Условие на значение.
· «Обязательное поле» определяет необходимость ввода данных в поле: можно указать «Да» (пустые значения допускаются) или «Нет» (пустые значения не допускаются).
· «Индексированное поле» - создав индекс, можно ускорить доступ к данным в поле, например, нужно выбрать «Да, совпадения не допускаются», если данное поле является ключевым полем.
· «Смарт-теги» - добавление данных распознанных и помеченных как особый тип, например имя пользователя или получателя.
· «Выравнивание текста» указывается способ выравнивания текста по умолчанию үнсіз келісім бойынша мәтінді тегістеу әдісін көрсетіледі.
· «Пустые строки» если для этого свойства указано «Да», то для для текстового и МЕМО поля можно вводит пустые строки.
· «Сжатие Юникод» определяет необходимость сжатия хранящегося в поле текста, если его размер меньше 4096 знаков.
· «Режим IME»- свойство управляющее преобразованием предложений в восточно-азиатской версии Windows.
· «Режим предложений IME»- свойство управляющее преобразованием предложений в восточно-азиатской версии Windows.
Структура данных.
Структура данных в ИС могут быть иерархической (древовидной), реляционной и сетевой.
В иерархической структуре исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы. Существенно то, что каждый порожденный элемент имеет только одного порождающего элемента (родителя).
Сетевые структуры более сложные структуры, в которых каждый порожденный элемент может иметь более одного порождающего элемента (родителя).
Базы данных, которые состоят из двумерных таблиц, называют реляционными. Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде двумерной таблицы или нормализовать структуру. Таким образом процесс превращения иерархической или сетевой структуры данных в реляционную называется нормализацией.
5. Основные понятия реляционных БД:
1) В реляционных БД любые совокупности данных представляются в виде двумерной таблицы.
2) Каждая таблица состоит из фиксированного числа столбцов и некоторого (переменного) количества строк. Описание столбцов, которое составляет пользователь, принято называть макетом таблицы.
3) Каждый столбец представляет конкретное данное. На языке БД столбцы таблицы называются полями, для каждого поля разработчик должен определить:
• уникальное имя поля;
• тип поля;
• дополнительные характеристики (длину, формат).
4) Каждая строка таблицы называется записью. Система нумерует записи по порядку: 1, 2, …, n, где n – общее число записей (строк) в таблице на данный момент. В отличие от количества полей (столбцов) в таблице, количество записей в процессе эксплуатации БД может изменятся как угодно (от нуля до миллионов). Количество полей, их имена и типы тоже можно изменить, но это особая операция, которая называется изменением макета таблицы.
5) Каждое поле может входить в несколько таблиц.
Реляционные БД обычно состоят из нескольких таблиц. Одна из которых является главным, а остальные подчиненными. Между этими таблицами существует связь либо «Один-ко-Многим», либо «Один-к-Одному». Эти связи всегда начинаются от главного и идут к подчиненным.
Кодирование информации.
Вместе с наименованиями (названиями) в ИС часто используются их цифровые или буквенные обозначения – коды (шифры). Применение кодов обусловлено тем, что во-первых, резко увеличивается объем вводимой информации (особенно если поле входит в несколько таблиц), так как названия могут быть длинными. Во-вторых, одно и то же название могут быть набраны по разному (например, областная больница, облбольница, областная больн.) и компьютер может запутаться.
Поэтому для многих полей вводят их цифровые или буквенные коды. Одновременно в базу данных включают таблицы, условно именуемые классификаторами (словарями, справочниками), в которых расшифровывают эти коды. Расшифровки используются при выдаче информации в удобочитаемой форме на печать или на экран дисплея.
Непременное условие корректности кода – его уникальность, т.е. данный код может принадлежать только данным, имеющим одно и то же значения.
Значность кода зависит от количества возможных значений данного. Так, национальность укладывается обычно в двузначный код, заказчики для больших предприятий в трехзначный или четырехзначный и т.п.
Какие данные и как следует кодировать? Это зависит от характера данных и от целей и возможностей разработчика.
Первичный ключ таблицы.
Каждая запись в таблице должна иметь первичный ключ, т.е. идентификатор (или адрес), значение которого определяет эту только эту запись.
Первичный ключ должен обладать следующими свойствами:
1) Однозначная идентификация записи: запись должна однозначно определяться значением ключа.
2) Отсутствие избыточности: никакое поле нельзя удалять из ключа, не нарушая при этом свойства однозначной идентификации.
3) Каждое значение первичного ключа в пределах таблицы должно быть уникальным. В противном случае невозможно отличить одну запись от другой.