- 23 октября 2025
- 4 минуты
- 303
Символ и его визуальные представления
Статью подготовили специалисты образовательного сервиса Zaochnik.
Определение понятия символ и способы представления
Символ — это конкретный графический знак.
Один и тот же символ может быть представлен различными способами. К примеру, два человека могут написать букву «A» от руки, и даже на экране компьютера она будет выглядеть по-разному в зависимости от шрифта. Тем не менее, это все равно останется одним и тем же символом. В то же время разные символы могут иметь схожий внешний вид, как, например, латинская «A» и русская «А». Несмотря на визуальное сходство, их лучше воспринимать как отдельные знаки.
Символами могут быть не только буквы (заглавные и строчные, латинские и кириллические), но также цифры, знаки препинания и специальные символы, такие как “=”, “(”, “&”, а также пробелы между словами.
Тексты формируются из символов, однако способ, которым информация хранится на компьютерах, не обязательно отражает её визуальное отображение. Вместо хранения самих символов используются их числовые представления. Внешний вид символа в зависимости от заданного кода определяется используемым шрифтом. Поэтому необходимо создать единый стандарт кодировки, чтобы обеспечивать читабельность текста, созданного на различных устройствах.
Стандарт ASCII
Первоначально было принято решение, что каждый символ будет представляться одним байтом, то есть 8 битами. Это позволяло закодировать 256 различных значений, что было достаточно для отображения латинских букв, цифр и некоторых знаков.
Стандарт, который определяет соответствие числовых кодов символам, называется ASCII. В ASCII-таблице содержится 128 символов с кодами от 0 до 127, что делает её семибитной.
Следует отметить, что ASCII не включает русские буквы и символы многих других алфавитов. Для отображения букв различных языков ранее использовалась вторая половина диапазона байта (коды от 128 до 255), что порождило множество проблем. Например, 128 значений недостаточно для охвата всех символов даже одного алфавита, такого как китайский. В конечном итоге был принят стандарт Unicode, версия 6.0 которого (октябрь 2010 года) включает более 109000 символов. Для кодирования символов Unicode требуются многобайтовые кодировки, так как для одного символа может потребоваться несколько байт.
Непечатные символы
Также стоит упомянуть, что не каждому числовому коду соответствует символ, который отображается на экране. Существуют так называемые управляющие коды, которые имеют значения меньше 32 в десятичной системе. Эти коды не отображают символы, а выполняют управленческие функции.
Например, код 07 издает звуковой сигнал, в то время как код 0C очищает экран.
Конец строки
Некоторые коды, такие как 10 (перевод строки, часто обозначаемый как LF) и 13 (возврат каретки, CR), имеют специальное значение. Первый код активирует переход на новую строку, а второй — возвращение в начало текущей строки. Для корректного начала новой строки требуется использование обоих этих кодов, которые сохраняются после каждой строки.
Обозначения конца строки различаются в зависимости от операционной системы. В Windows это два символа (13 и 10), в GNU/Linux — один символ (10), а в MacOS — один символ (13).
Исторические термины «возврат каретки» и «перевод строки» берут своё начало от механизма пишущих машинок.
Ввод символов по коду
В операционной системе Windows возможно вводить произвольный символ по его коду (в десятичном представлении) с зажатой клавишей Alt, используя клавиатуру с цифровым блоком.