Представление текстовой информации в памяти компьютера

Представление текстовой информации в памяти компьютера - student2.ru
Текст состоит из символов букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает ввоДимые СИМВОЛЫ по их Двоичному коду. Вы нажимаете на клавиатуре символьную клавишу, и в компьютер поступает определённая последовательность электрических импульсов разной силы, которую можно представить в виде цепочки из восьми нулей и единиц (двоичного кода).

Мы уже говорили о том, что разрядность двоичного кода (Ё) и количество возможных кодовых комбинаций (N) связаны соотношением: 2' N. Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций: 28 256.

С помощью такого количества кодовых комбинаций можно закодировать все символы, расположенные на клавиатуре компьютера, — строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и т. д., а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, перевод строки, пробел и др.).

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.

Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

Кодовая таблица содержит коды для 256 различных символов, пронумерованных от О до 255. Первые 128 кодов во всех кодовых таблицах соответствуют одним и тем же символам:

• коды с номерами от 0 до 32 соответствуют управляющим символам;

• коды с номерами от 33 до 127 соответствуют изображаемым символам — латинским буквам, знакам препинания, цифрам, знакам Представление текстовой информации в памяти компьютера - student2.ru арифметических операций и т. д.

Эти коды были разработаны в США и получили название ASCII (American Standart Code for Information Interchange Представление текстовой информации в памяти компьютера - student2.ru Американский стандартный код для обмена информацией). В табл. 4.1 представлен фрагмент кодировки ASCII.

Таблица 4.1

Оценка количественных параметров S 4.6

Представление текстовой информации в памяти компьютера - student2.ru Фрагмент кодировки ASCII

Символ ДесятичныЙ код (номер) Двоичный Символ Десятичный код (номер) Двоичный код
Пробел о
 
 
  з
 
 
     
 
 
  Представление текстовой информации в памяти компьютера - student2.ru
   
в о Представление текстовой информации в памяти компьютера - student2.ru
с  

Представление текстовой информации в памяти компьютера - student2.ru

Символ Десятичвый код (номер) Двоичный код Символ Десятичный код (номер) Двоичный код
   
   
   
  т
н  
     
   
к х  
   
м  

 
  Представление текстовой информации в памяти компьютера - student2.ru

Коды с номерами от 128 до 255 используются для кодирования букв национального алфавита, символов национальной валюты и т. п. Поэтому в кодовых таблицах для разных языков одному и тому же коду соответствуют разные символы. Более того, для многих языков существует несколько вариантов кодовых таблиц (например, для русского языка их около десятка!).

В табл. 4.2 представлены десятичные и двоичные коды нескольких букв русского алфавита в двух различных кодировках.

Таблица 4.2 Представление текстовой информации в памяти компьютера - student2.ru

Коды русских букв в разных кодировках

Символ Кодировка
Windows кои-8
десятичный код двоичный код десятичный код двоичный код
 
 
в Представление текстовой информации в памяти компьютера - student2.ru

Оценка количественных параметров 5 4.6 Представление текстовой информации в памяти компьютера - student2.ru

Например, последовательности двоичных кодов 11010010 11000101 11001010 11010001 11010010 в кодировке Windows будет соответствовать слово 4 ТЕКСТ», а в ко Представление текстовой информации в памяти компьютера - student2.ru дировке КОИ-8 — бессмысленный набор символов «рейяр».

Представление текстовой информации в памяти компьютера - student2.ru Как правило, пользователь не должен заботиться о перекодирова Представление текстовой информации в памяти компьютера - student2.ru нии текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

Восьмиразрядные кодировки обладают одним серьёзным ограничением: количество различных кодов символов в этих кодировках недостаточно велико, чтобы можно было одновременно пользоваться более чем двумя языками. Для устранения этого ограничения был Представление текстовой информации в памяти компьютера - student2.ru разработан новый стандарт кодирования символов, получивший название Unicode. В Unicode каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет Представление текстовой информации в памяти компьютера - student2.ru закодировать 65 536 различных символов:

2 16 —65 536.

Представление текстовой информации в памяти компьютера - student2.ru Первые 128 символов в Unicode совпадают с таблицей ASCII; далее размещены алфавиты всех современных языков, а также все математические и иные научные символьные обозначения. С каждым годом Unicode получает всё более широкое распространение.

Представление текстовой информации в памяти компьютера - student2.ru В Единой коллекции цифровых образовательных ресурсов размещены анимации «Клавиатура ПЭВМ: принципы работы; устройство клавиши», «Клавиатура ПЭВМ: принципы работы; сканирование клавиш», «Клавиатура ПЭВМ: формирование кода введенного символа», которые помогут вам наглядно увидеть, как формируется код символа, введённого с клавиатуры.

Наши рекомендации