254. Типы текстовых форматов

| |

Типы текстовых форматов

Собственно текстовые файлы, имеющие расширение ТХТ, хранят только информацию о символах текста, зашифрованную с помощью кодовых таблиц символов. Эти таблицы (их несколько) являются стандартными и их применение определено международными соглашениями. В таблице кодировки каждому символу латинского алфавита присвоен уникальный двоичный код. Для символов национальных алфавитов в странах, где они используются (в частности, для кириллицы), применяются расширенные кодовые страницы.

К наиболее распространенным текстовым форматам относятся ASCII (American Standart Code for Information Interchange), ANSI (American National Standart Insitiute) и UNICODE. Они различаются таблицей кодировки символов. Формат ASCII — базовый уровень представления текстовой информации, он един для всех программных средств, работающих с текстами. В тексте ASCII нет полужирного и курсивного начертания, отсутствует система гарнитур и кеглей. В таком документе нет отступов, и, как правило, каждая строка представляет собой отдельный абзац. Зато у файлов в текстовом формате есть одно очень важное достоинство — они стандартные.

К текстовым в настоящее время относят и файлы, подготовленные в одном из текстовых процессоров и сохраненные в его формате. В состав этих файлов входит не только информация об их содержании (т. е. коды символов), но и о способе представления этих символов. В файлах таких форматов хранятся данные о шрифтах, кеглях, начертаниях, разбивке на абзацы и страницы, размере полосы набора, иногда о стилях абзацев и символов, т. е. обо всех элементах форматирования данного текста.

Файлы с форматированием создаются в текстовых процессорах различного класса. В зависимости от возможностей текстового процессора, отличается и объем информации о форматировании, хранящейся вместе с файлом. Простые процессоры содержат информацию о шрифтах, начертании, кегле, разбиении на абзацы. Развитые текстовые процессоры могут хранить данные о стилях абзацев и символов, отступы и отбивки, таблицы, вложенную графику и пр. К наиболее распространенным текстовым форматам относятся DOC и RTF (Rich Text Format — стандартный формат хранения текстовой информации), созданный для обмена данными между текстовыми процессорами и программами верстки.

Еще больше сведений о форматировании содержится в файлах программ верстки — кроме атрибутов символов, абзацев, в них имеются данные о связанных и внедренных изображениях, о размещении, взаимодействии и свойствах текстовых фреймов, о параметрах цветоделения и пр. К форматам систем верстки относятся, например, Р65, РМ6 — файлы программы PageMaker, QXD — публикации QuarkXpress, VP — документы, подготовленные в программе Ventura Publishing.

Особое место занимают текстовые файлы со стилевой разметкой — Tagged Format — при сохранении в нем создается стилевая разметка — в нужных местах проставляются метки (тэги), указывающие на характер форматирования. Полученный документ является обычным ASCII-файлом. При импорте такого файла в программу, поддерживающую команды стилевой разметки, будет автоматически осуществляться форматирование по разметке.


| |