Электронные издания



         

Применение программ-экстракторов - часть 2


И с ними TextAnalyst успешно справляется.

В настоящее время распространяется новая версия TextAnalyst 2.01, которая разработана в качестве инструмента для анализа содержания текстов, смыслового поиска информации, формирования электронных архивов, и предоставляет пользователю следующие основные возможности:

  • анализа содержания текста с автоматическим формированием семантической сети с гиперссылками - получения смыслового портрета текста в терминах основных понятий и их смысловых связей;

    анализа содержания текста с автоматическим формированием тематического древа с гиперссылками - выявления семантической стру ктуры текста в виде иерархии тем и подтем;

    смыслового поиска с учетом скрытых смысловых связей слов запро са со словами текста;

    автоматического реферирования текста - формирования его смы слового портрета в терминах наиболее информативных фраз;

    кластеризации информации - анализа распределения материала текстов по тематическим классам;

    автоматической индексации текста с преобразованием в гипертекст;

    ранжирования всех видов информации о семантике текста по «степени значимости» с возможностью варьирования детальности ее исследования;

    автоматического/автоматизированного формирования полнотекстовой базы знаний с гипертекстовой структурой и возможностями ассоциативного доступа к информации.

    Результаты работы программы TextAnalyst 2.01. представлены на рис. 7.9

    Рис. 07.09.
    .

    В тексте выделены цветом и подчеркнуты термины, которые TextAnalyst 2.01 предлагает использовать в качестве ключевых слов, терминов, отражающих смысловое содержание работы. Пользователь может исключить часть этих слов или добавить другие, что будет учтено программой в дальнейшей работе. По нашему мнению, эта программа может успешно использоваться для автоматизации извлечения метаинформации из загружаемых в хранилище изданий.

    7.5.




    Содержание  Назад  Вперед