Кодировка - совокупность соответствий ряда чисел символам (буквам, цифрам, знакам). В Internet наиболее используемы кодировки русского алфавита КОИ-8R и Win-1251.
Кодировка - набор символов (character set) - таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита.
Хотя термин "набор символов" (character set, charset), узаконенный интернет-стандартом RFC 2278, сейчас является, пожалуй, наиболее авторитетным, предшествовавший ему термин "кодировка" (encoding) по-прежнему используется в качестве синонима, в частности, в языках программирования Java, Perl и XSLT, а также в HTML.
В настоящее время в основном используются кодировки трёх типов: Совместимые с ASCII, Совместимые с EBCDIC, Основанные на Юникоде 16-битные, с подавляющим преобладанием первых.
Представление UTF-8 Юникода совместимо с ASCII. Кодировки на базе EBCDIC (например, ДКОИ-8) используются только на некоторых мэйнфреймах. Первоначально в каждой операционной системе использовался один набор символов. Теперь используемые наборы символов стандартизованы, зависят от типа операционной системы лишь по традиции и устанавливаются согласно локали.
|