Кодирование данных в компьютере
Данные в компьютере хранятся и обрабатываются в виде кодов.
Кодом называют совокупность знаков некоторого алфавита, приводимая в однозначное соответствие определенному понятию. Присвоение понятию соответствующего кода называют кодированием.
В компьютерах, как правило, для кодирования используется двоичный алфавит, состоящий из двух знаков - 0 и 1
Для кодирования в двоичном алфавите двух состояний достаточно одной двоичной единицы - одного бита. Например, левая и правая стороны, слова Нет и Да могут быть закодированы соответственно знаками 0 и 1.
Для кодирования от пяти до восьми состояний, объектов, альтернатив, сообщений, событий, букв требуется уже трехбитовый код, который имеет следующие наборы значений битов: 000, 001, 010, 011, 100, 101, 110 и 111. Подобные наборы значений битов называют двоичными словами.
В общем случае, максимальное число М объектов, которое может быть закодировано Н-битовым словом определяется формулой (1.2), полученной из зависимости К.Шеннона. В частности, для кодирования символов национальных алфавитов, управляющих символов, цифр, математических символов широко применяется 8-битовая кодировка, так называемые ASCII коды.
Таким образом, данные в компьютере – это последовательности двоичных единиц.
Измерение компьютерных данных
Минимальная единица измерения компьютерных данных – бит. Объем двоичных данных в 8 бит называется байтом. Байт - минимальная единица хранения символьных данных.
На практике широко используются и более объемные, производные единицы:
1 килобайт (Кбайт) = 210 байтов = 1024 байтов,
1 мегабайт (Мбайт) = 210 килобайтов = 220 байтов,
1 гигабайт (Гбайт) = 210 мегабайтов = 230 байтов,
1 терабайт (Тбайт) = 210 гигабайтов = 240 байтов.
В целях экономии памяти при записи информации на оптические или магнитные носители широко используют процедуру сжатия данных. Так текст книги, представленный в виде кодов ASCII можно сжать примерно в десять раз. При этом очевидно, что путем сжатия уменьшается не количество информации, а только объем ее сохраняющих данных.
Поэтому более правильно говорить о количестве информации, содержащейся в некотором сообщении, документе, книге, и объеме памяти, потребной для записи и хранения этого документа в запоминающем устройстве компьютера.
Часто вместо слова данные употребляют слово информация. Теперь же мы из контекста можем понимать, о чем на самом деле идет речь.
Измерение информации (данных) в байтах, страницах иногда называют прагматическоймерой информации.
Лекция 2
Арифметические основы компьютеров
Системы счисления
Системой счисления называют совокупность приемов составления, обозначения и именования чисел.
Различают позиционные и непозиционные системы.
В позиционных системах счисления количество, определяемое цифрой числа, зависит от позиции этой цифры в записи числа. Например, 535 = 500 + 30 + 5.
К непозиционным системам относят, например, римскую систему счисления. У нее количество, определяемое цифрой числа, не зависит от места этой цифры в записи числа. Например, XXV = 10+10+5.
Название и характеристики позиционной системы определяются ее основанием. Основание системы счисления – это объем ее алфавита.
Алфавит системы счисления– множество символов для обозначения цифр числа в этой системе счисления.
Пример алфавитов систем счисления с основанием р:
р = 10, алфавит: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,
р = 2, алфавит: 0, 1,
р = 8, алфавит: 0, 1, 2, 3, 4, 5, 6, 7
р = 16, алфавит: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, А, В, С, D, Е, F.
В табл. 2.1 представлены записи первых семнадцати чисел в этих системах счисления.
Двоичная система счисления используется для представления чисел в компьютере и выполнения арифметических действий с ними ввиду удобства аппаратной (микропроцессорной) реализации. Шестнадцатеричная и восьмеричная системы счисления используются для отображения компьютерных данных, т.к. такое их отображение легко читается профессионалами.
Таблица 2.1
Р = 10 | р = 2 | р = 8 | р = 16 |
А | |||
B | |||
C | |||
D | |||
E | |||
F | |||
Перевод чисел в десятичную систему счисления
Введем следующие обозначений номеров цифр (ц) в числе любой системы счисления, содержащем m целых разрядов до запятой и n дробных разрядов после запятой[:
число: | ц | … | ц | ц | ц | ц | , | ц | ц | … | ц |
№ цифры в числе: | m-1 | -1 | -2 | … | -n |
С учетом введенных обозначений число можно записать в виде:
цm-1…ц3ц2ц1ц0,ц-1ц-2…ц-n
Число любой системы счисления может быть представлено в виде разложения по степеням основания р системы счисления, в которой записано это число:
цm-1×рm-1 +…+ ц3×р3 + ц2×р2 + ц1×р1 + ц0×р0 + ц-1×р-1 + ц-2×р-2 +…+ ц-n×р-n 2.1
Сумма членов этого многочлена дает число в десятичной системе сложения.
Например, одно и то же число, записанное в разных системах счисления, А(10)=535,5; А(2)=1000010111,1; А(8)=1027,4; А(16)=217,8 может быть представлено в виде разложения по степеням основания, сумма которого равна десятичному числу 535,5:
р = 10 : 5×102 + 3×101 + 5×100 + 5×10-1= 500 + 30 + 5 + 5×(1/10) = 535,5
р = 2 : 1×29 + 0×28 + 0×27 + 0×26 + 0×25 + 1×24 + 0×23 + 1×22 + 1×21 + 1×20 + 1×2-1 =
= 512 + 0 + 0 + 0 + 0 + 16 + 0 + 4 + 2 + 1 + 0,5 = 535,5
р = 8 : 1×83 + 0×82 + 2×81 + 7×80 + 4×8-1 = 512 + 0 + 16 + 7 + 0,5 = 535,5
р = 16 : 2×162 + 1×161 + 7×160 + 8×16-1 = 512 + 16 + 7 + 0,5 = 535,5