Теория:
Текст — зафиксированная на каком-либо материальном носителе человеческая мысль; в общем плане связная и полная последовательность символов.
При нажатии на клавиатуре символьной клавиши, в компьютер поступает определённая последовательность электрических импульсов разной силы, которую можно представить в виде цепочки из нулей и единиц (двоичного кода).
Разрядность двоичного кода ( \(i\) ) и количество возможных кодовых комбинаций ( \(N\) ) связаны соотношением: \(2\) в степени \(i = N\).
Обрати внимание!
Все символы, расположенные на клавиатуре кодируются с помощью восьмиразрядного кода. Исходя из формулы , получим \(256\) кодовых комбинаций. \(256\) комбинаций хватает на кодировку не только букв, цифр, арифметических знаков, но и основных управляющих символов, например delete, backspace и т. п.
Соответствие кодовых комбинаций и символов можно найти в кодовых таблицах.
Абсолютно все используемые кодовые таблицы составляются по международным стандартам кодирования символов.
В любой кодовой таблице первые \(128\) кодов одинаковые:
- коды с номерами от \(0\) до \(32\) соответствуют управляющим символам;
- коды с номерами от \(33\) до \(127\) соответствуют изображаемым символам — латинским буквам, знакам препинания, цифрам, знакам арифметических операций и т. д.
Эти коды были разработаны в США и получили название ASCII (American Standart Code for Information Interchange — Американский стандартный код для обмена информацией).
Коды с номерами от \(128\) до \(255\) используются для кодирования букв национального алфавита, символов национальной валюты и т.п. Поэтому в кодовых таблицах для разных языков одному и тому же коду соответствуют разные символы. Более того, для многих языков существует несколько вариантов кодовых таблиц (например, коды русских букв представляют в кодировках Windows, КОИ-8).
Перекодирование текстовых документов делают специальные программы-конверторы, встроенные в операционную систему и приложения.
Восьмиразрядные кодировки обладают одним серьёзным ограничением: количество различных кодов символов в этих кодировках недостаточно велико, чтобы можно было одновременно пользоваться более чем двумя языками.
Восьмиразрядные кодировки обладают одним серьёзным ограничением: количество различных кодов символов в этих кодировках недостаточно велико, чтобы можно было одновременно пользоваться более чем двумя языками.
В Unicode (новый стандарт кодирования символов) каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать \(65 536\) различных символов:
\(2\) в \(16\) степени — \(65 536\).
\(2\) в \(16\) степени — \(65 536\).
Первые \(128\) символов в Unicode совпадают с таблицей ASCII; далее размещены алфавиты других современных языков, а также все математические и иные научные символьные обозначения. С каждым годом Unicode получает всё более широкое распространение.
Пример кодирования в разных кодовых таблицах:
