Кодирование данных в компьютере

Данные в компьютере хранятся и обрабатываются в виде кодов.

Кодом называют совокупность знаков некоторого алфавита, приводимая в однозначное соответствие определенному понятию. Присвоение понятию соответствующего кода называют кодированием.

В компьютерах, как правило, для кодирования используется двоичный алфавит, состоящий из двух знаков - 0 и 1

Для кодирования в двоичном алфавите двух состояний достаточно одной двоичной единицы - одного бита. Например, левая и правая стороны, слова Нет и Да могут быть закодированы соответственно знаками 0 и 1.

Для кодирования от пяти до восьми состояний, объектов, аль­тернатив, сообщений, событий, букв требуется уже трехбитовый код, который имеет следующие наборы значений битов: 000, 001, 010, 011, 100, 101, 110 и 111. Подобные наборы значений битов называют двоичными словами.

В общем случае, максимальное число М объектов, которое может быть закодировано Н-битовым словом определяется формулой (1.2), полученной из зависимости К.Шеннона. В частности, для кодирования символов национальных алфавитов, управляющих символов, цифр, математических символов широко применяется 8-битовая кодировка, так называемые ASCII коды.

Таким образом, данные в компьютере – это последовательности двоичных единиц.

Измерение компьютерных данных

Минимальная единица измерения компьютерных данных – бит. Объем двоичных данных в 8 бит называется байтом. Байт - минимальная единица хранения символьных данных.

На практике широко используются и более объемные, производные единицы:

1 килобайт (Кбайт) = 210 байтов = 1024 байтов,

1 мегабайт (Мбайт) = 210 килобайтов = 220 байтов,

1 гигабайт (Гбайт) = 210 мегабайтов = 230 байтов,

1 терабайт (Тбайт) = 210 гигабайтов = 240 байтов.

В целях экономии памяти при записи информации на оптические или магнитные носители широко используют процедуру сжатия данных. Так текст книги, представленный в виде кодов ASCII можно сжать примерно в десять раз. При этом очевидно, что путем сжатия уменьшается не количество информации, а только объем ее сохраняющих данных.

Поэтому более правильно говорить о количестве информации, содержащейся в некотором сообщении, документе, книге, и объе­ме памяти, потребной для записи и хранения этого документа в запоминающем устройстве компьютера.

Часто вместо слова данные употребляют слово информация. Теперь же мы из контекста можем понимать, о чем на самом деле идет речь.

Измерение информации (данных) в байтах, страницах иногда называют прагматическоймерой информации.

Лекция 2

Арифметические основы компьютеров

Системы счисления

Системой счисления называют совокупность приемов составле­ния, обозначения и именования чисел.

Различают позиционные и непозиционные системы.

В позиционных системах счисления количество, определяемое цифрой числа, зависит от позиции этой цифры в записи чис­ла. Например, 535 = 500 + 30 + 5.

К непозиционным системам относят, например, римскую систему счисления. У нее количество, определяемое цифрой числа, не зависит от места этой цифры в записи числа. Например, XXV = 10+10+5.

Название и характеристики позиционной системы определяются ее основанием. Основание системы счисления – это объем ее алфавита.

Алфавит системы счисления– множество символов для обозначения цифр числа в этой системе счисления.

Пример алфавитов систем счисления с основанием р:

р = 10, алфавит: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,

р = 2, алфавит: 0, 1,

р = 8, алфавит: 0, 1, 2, 3, 4, 5, 6, 7

р = 16, алфавит: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, А, В, С, D, Е, F.

В табл. 2.1 представлены записи первых семнадцати чисел в этих системах счисления.

Двоичная система счисления используется для представления чисел в компьютере и выполнения арифметических действий с ними ввиду удобства аппаратной (микропроцессорной) реализации. Шестнадцатеричная и восьмеричная системы счисления используются для отображения компьютерных данных, т.к. такое их отображение легко читается профессионалами.

Таблица 2.1

Р = 10 р = 2 р = 8 р = 16
А
B
C
D
E
F

Перевод чисел в десятичную систему счисления

Введем следующие обозначений номеров цифр (ц) в числе любой системы счисления, содержащем m целых разрядов до запятой и n дробных разрядов после запятой[:

число: ц ц ц ц ц , ц ц ц
№ цифры в числе: m-1     -1 -2 -n

С учетом введенных обозначений число можно записать в виде:

цm-1…ц3ц2ц1ц0-1ц-2…ц-n

Число любой системы счисления может быть представлено в виде разложения по степеням основания р системы счисления, в которой записано это число:

цm-1×рm-1 +…+ ц3×р3 + ц2×р2 + ц1×р1 + ц0×р0 + ц-1×р-1 + ц-2×р-2 +…+ ц-n×р-n 2.1

Сумма членов этого многочлена дает число в десятичной системе сложения.

Например, одно и то же число, записанное в разных системах счисления, А(10)=535,5; А(2)=1000010111,1; А(8)=1027,4; А(16)=217,8 может быть представлено в виде разложения по степеням основания, сумма которого равна десятичному числу 535,5:

р = 10 : 5×102 + 3×101 + 5×100 + 5×10-1= 500 + 30 + 5 + 5×(1/10) = 535,5

р = 2 : 1×29 + 0×28 + 0×27 + 0×26 + 0×25 + 1×24 + 0×23 + 1×22 + 1×21 + 1×20 + 1×2-1 =

= 512 + 0 + 0 + 0 + 0 + 16 + 0 + 4 + 2 + 1 + 0,5 = 535,5

р = 8 : 1×83 + 0×82 + 2×81 + 7×80 + 4×8-1 = 512 + 0 + 16 + 7 + 0,5 = 535,5

р = 16 : 2×162 + 1×161 + 7×160 + 8×16-1 = 512 + 16 + 7 + 0,5 = 535,5

Наши рекомендации