Что такое ASCII?
ASCII – аббревиатура американского стандартного кода информационного обмена. В английской интерпретации звучит как «аски», в американской как «эски».
ASCII является кодировкой, представляющей десятичные цифры, национальный и латинский алфавит, управляющие символы и знаки препинания. Будучи изначально 7-битной, ASCII с распространением байта 8-битного стала позиционироваться как половинка 8-битной. В компьютерах чаще применяются расширения ASCII с использованием второй половины байта.
Стандарт ECMA-6 (ISO 646) позволяет размещать национальные символы на месте @. Кроме того на месте # возможно размещение £, и ¤ – на месте $. Данная система прекрасно адаптирована к европейским языкам, нуждаясь дополнительно лишь в нескольких символах. Стандарт ASCII без использования национальных «ярлыков» именуется как US-ASCII.
Для ряда языков нелатинской письменности (греческого, русского, иврита, арабского) существовали особые варианты ASCII. Так, одна из модификаций предполагала отказ от латинских строчных букв, уступив место национальным символам. Другая – переключение «на ходу» посредством символов Shift Out (SO) и Shift In (SI) между национальной версией и US-ASCII. В данном случае можно было совсем устранять латинские символы, занимая их пространство своими.
Но наиболее оптимальным вариантом стало использование 8-битных кодовых страниц (кодировок). Где нижняя часть в кодовой таблице (0–127) занята символами US-ASCII, а верхняя (128 – 255) – дополнительными символами, включая набор национальных. То есть верхняя часть таблицы до массового распространения Юникода применялась для отражения местных символов. При отсутствии универсального шаблона возникало немало проблем с разными кодировками (Windows-1251, КОИ-8 и т.д.).