Электронные издания



         

Форматы представления текстовых блоков электронного издания - часть 2


В том случае, когда электронное издание не содержит мультимедиа-компонентов, то оно может храниться в формате любого текстового редактора или верстального пакета; единственное дополнительное требование к текстовому редактору состоит в том, что он должен поддерживать графические форматы рисунков, если они включены в текст издания.

Для чисто текстовых изданий ограничений еще меньше. Их можно хранить и распространять в любом текстовом формате, используемом в современных персональных компьютерах. В частности, может использоваться форматТХТ (в том числе «простой текст» или plain text), гораздо более экономичный, чем формат DOC. Для кодирования любого символа такого текста используется всего один байт. Пример такой кодировки представляет

American Standart Code for Information Interchange (ASCII) - Американский стандартный код для обмена информацией
American Standart Code for Information Interchange (ASCII) - Американский стандартный код для обмена информацией. Для языков на основе латиницы и кириллицы такое кодирование вполне удовлетворительно.

Однако для некоторых восточных языков, например китайского или японского, этот подход неприменим, так как разнообразие символов в этих языках многократно превышает 256 - предельное значение этого параметра в ASCII-стандарте. В последние годы все более прочные позиции приобретает стандарт Unicode, или ISO 10646, т. е. стандарт под номером 10646 Международной организации по стандартизации (International Organization for Standartization). В этом стандарте каждый символ кодируется уже 2 байтами, т. е. предельное разнообразие символов достигает значения 65536. Этот стандарт часто называют стандартом многоязыковой поддержки, так как он позволяет кодировать символы государственных языков всех стран нашей планеты.

Однако в ТХТ-формате электронное издание не удовлетворяет даже самым скромным эстетическим запросам, так как в нем нет возможности использования не только графики, но даже шрифтов различного начертания, заголовков и подзаголовков, примечаний и других элементов, которые в совокупности называют «разметкой текста» (markup).




Содержание  Назад  Вперед