Новые информационные технологии. Основы и аппаратное обеспечение


ASCII и таблицы кодировки


 

Имеются специальные стандарты, ставящие в соответствие каждый код определенному знаку. Сейчас самым признанным стандартом стал ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). В нем каждое значение байта соотносится с определенным символом, например, 65 - это код латинской буквы «A»,  66 - «B» и т.д.

В новых операционных системах для компьютеров, например Windows 98/2000/NT/XP, применяются и двухбайтные коды (Unicode), позволяющие довести число кодируемых знаков до 65536 символов. Этого достаточно для кодирования самых сложных языков.

          В компьютере или ином информационном устройстве имеется также один или несколько наборов знаков (так называемых таблиц знакогенератора), которые ставят в однозначное соответствие код знака с его начертанием на экране дисплея. В результате с помощью специальной алфавитно-цифровой клавиатуры можно преобразовать знак любого языка на любой клавише в код, а с помощью знакогенератора дисплея вывести этот знак на экран дисплея.

          Преобразовав символы в коды, нетрудно автоматизировать операции с текстами. Например, несложно подсчитать число символов в строке, выделить первый, последний или вообще любой символ, выполнить сортировку слов, осуществить замену одного символа или подстроки на другой (другую) и даже осуществить автоматическую проверку орфографии и грамматики, используя для этого определенные наборы правил того языка, на котором создается и обрабатывается текст. Все это и делают текстовые редакторы и более мощные текстовые процессоры, такие, как всемирно известный Microsoft Word.




Начало  Назад  Вперед