Электронные издания



         

Форматы представления текстовых блоков электронного издания - часть 3


Из языков разметки текста помимо HTML, рассмотренного в предыдущей главе, наибольшее распространение получили:

  • TROFF, применяющийся при оформлении документации в рамках операционной системы UNIX и различных ее версий, включая LINUX;

    ТЕХ, который широко используется для подготовки изданий с большим количеством математических формул;

    SGML (Standart Generic Markup Language).

    Исходная программа форматирования электронных документов в системе UNIX называлась ROFF (от Run OFF - тиражирование). TROFF означает Typesetting ROFF, т. е. форматирование текста для принтеров с высоким разрешением и фотонаборных устройств. Хотя область распространения этого языка и поддерживающих его программ постепенно сужается, в США он продолжает использоваться для создания электронных отчетов, которые могут одинаково успешно выводится на терминалах с низким разрешением и распечатываться с полиграфическим качеством.

    Система верстки и язык ТЕХ был разработан хорошо известным среди программистов и математиков профессором Дональдом Кнутом для подготовки книг и пособий по математическим дисциплинам. ТЕХ работает на различных аппаратных и программных платформах. Его можно отыскать в сети Интернети бесплатно перенести паевой компьютер. Имеются и коммерческие версии этого продукта, в частности для платформы Macintosh фирмы Apple. Отметим, что помимо математических книг на этом языке издаются различные академические журналы, в том числе и в нашей стране.

    Язык SGML реализует принцип логической разметки текста, который позволяет разграничить содержимое издания и его электронное представление. Именно этим принципом руководствовались специалисты фирмы

    IBM, создавшие этот язык, который с 1986 г. получил статус международного стандарта. Кстати, HTML был создан именно на основе SGML. Основное достоинство языка SGML состоит в его универсальности независимости от программных средств для его интерпретации. Этот формат может быть конвертирован в форматы TROFF или ТЕХ. Язык изначально создан для производственных нужд, связанных с длительным хранением электронных документов большого объема, таких как описания крупных проектов или их документация.

    Большинство из перечисленных текстовых форматов можно встретить в многочисленных «Электронных библиотеках», представленных в сети Интернет, о чем подробнее будет сказано в главе 8. Для ускорения загрузки таких изданий на компьютер пользователя они нередко представлены в архивированном виде, для чего чаще всего используются программы-архиваторы ARJ, ZIP и RAR, работающие в DOS'e, и WINZIP и WINRAR, предназначенные для работы в оболочке Windows.

    Специальные языки разметки страниц в будущем будут активно развиваться. Одна из причин этого связана с автоматизацией извлечения информации из подготовленных электронных изданий. Такая операция обязательно производится для облегчения поиска информации, в частности, в сети Интернет. Для изданий, в производстве которых использованы принципы логической разметки и языки разметки страниц, многократно повышается эффективность поиска ключевых слов и выражений, адекватно отражающих содержание этих изданий.

    3.3.




    Содержание  Назад  Вперед