Электронные издания



         

Информационная структура современного издательства - часть 3


Рассмотрим основные компоненты информационной структуры издательства. Основные компоненты системы локализуются на сервере или нескольких серверах. В частности, отдельный сервер обычно используют для ведения издательской базы данных. Иногда может быть выделен специальный сервер доставки информации клиенту, реже - сервер для поиска нужных электронных изданий. Для интеграции сервера (серверов) с клиентскими компьютерами используется издательская интрасеть. Наконец, посредством экстрасети и сети Интернет могут быть подключены территориально удаленные сотрудники издательства и некоторые контрагенты, с которыми поддерживается регулярная информационная связь.

Ядром любой издательской информационной системы является хранилище изданий. Естественно, издания хранятся в электронной форме, т. е. хранилище электронных изданий - основной компонент информационной системы издательства. Поэтому требования к этому компоненту и особенности организации хранения электронных изданий будут рассмотрены в специальном параграфе. Здесь следует лишь отметить, что для организации эффективного поиска изданий необходимо хранить атрибутивную информацию или метаданные, т. е. имя автора или авторов, название издания, время первой публикации издания, название издательства, кому принадлежат авторские права, характер представления данных (тип файла) и пр.

Загрузчик является той частью издательской системы, которая должна сделать ввод изданий и документов настолько эффективным, насколько это возможно. Поскольку количество вводимой информации велико, становится понятно требование минимизации ручного труда в этом процессе.

При вводе документов одновременно должны генерироваться метаданные для каталогизации и индексирования, на основе которых документы могут затем извлекаться пользователями. Известно несколько способов автоматизации, соответствующих разным методам доступа к данным. Наиболее известен и хорошо отработан метод автоматической индексации полного текста. Самые прогрессивные средства индексации текста базируются на технологии семантических сетей, в которой значения слов определяются по контексту, а не просто подбором унифицированных терминов для отдельных слов, однако пока работу программных средств нельзя назвать безупречной.


Содержание  Назад  Вперед