Словарь терминовЛитера - К ► Кодировка

Кодировка

Кодировка - совокупность соответствий ряда чисел символам (буквам, цифрам, знакам).
В Internet наиболее используемы кодировки русского алфавита КОИ-8R и Win-1251.

Кодировка - набор символов (character set) - таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита.

Хотя термин "набор символов" (character set, charset), узаконенный интернет-стандартом RFC 2278, сейчас является, пожалуй, наиболее авторитетным, предшествовавший ему термин "кодировка" (encoding) по-прежнему используется в качестве синонима, в частности, в языках программирования Java, Perl и XSLT, а также в HTML.

В настоящее время в основном используются кодировки трёх типов:
Совместимые с ASCII,
Совместимые с EBCDIC,
Основанные на Юникоде 16-битные, с подавляющим преобладанием первых.


Представление UTF-8 Юникода совместимо с ASCII. Кодировки на базе EBCDIC (например, ДКОИ-8) используются только на некоторых мэйнфреймах. Первоначально в каждой операционной системе использовался один набор символов.
Теперь используемые наборы символов стандартизованы, зависят от типа операционной системы лишь по традиции и устанавливаются согласно локали.