Metric О насНАШИ УСЛУГИНАШИ РАБОТЫНОВОСТИКОНТАКТЫ
Главная


на главную

поиск

обратная связь

In English



Архив новостей

Подписка на новости


Подписаться
Отказаться

Введите e-mail




21.01.2003, RCO

Вышла новая версия библиотеки анализа текста RCO Semantic Network 2.0

Компания Гарант-Парк-Интернет объявляет о выходе новой версии программного продукта RCO Semantic Network 2.0, который предназначен для автоматического анализа текста. Продукт предназначен для разработчиков информационно-поисковых и аналитических систем и позволяет выявить ключевые понятия документа с их взаимосвязями на основе грамматического и статистического анализа текста, а также получить несколько видов рефератов документа. Продукт поставляется в виде динамической библиотеки (dll) для Windows. Первым пользователем новой версии библиотеки стало одно из подразделений ФАПСИ.

Средства библиотеки RCO Semantic Network позволяют автоматически анализировать содержание текстовых документов, представляя его в форме ассоциативной семантической сети, узлами которой служат значимые понятия-темы, выделенные из текста. Выделение тем происходит путем синтактико-семантического анализа текста, который позволяет выделять различные семантические типы понятий текста. Для последующей обработки результатов используется тезаурус, который отождествляет синонимы и приводит слова к обобщающим понятиям-темам, а также фильтрует общеупотребимую лексику из числа тем. Так, словам "российский", "россиянин" и "Российская федерация" будет соответствовать тема "Россия", а слова "концепция" и "развитие", обладающие общим значением, не выделятся в качестве отдельных тем, но могут образовать тему в сочетании с другими словами, например "концепция развития сельского хозяйства".

Дополнительно между темами сети устанавливаются ассоциативные связи, которые отражают совместное упоминание тем в тексте и могут использоваться для расширения или уточнения запроса при поиске в информационных массивах, а также выявления информации о различных взаимосвязях между целевыми объектами в аналитических задачах.

Основное отличие новой версии от предшествующей заключается в использовании новых лингвистических алгоритмов, которые не только существенно повысили качество анализа, но и позволили выделять понятия различных семантических категорий, например: наименования организаций, физических лиц, географические названия, действия. Кроме того, библиотека теперь позволяет получать несколько видов реферата текста: общий, по заданной теме или по связи заданных тем.

Область применения RCO Semantic Network охватывает задачи построения информационного портрета документа, тематического индексирования полнотекстовых баз данных, выявления скрытых взаимосвязей между объектами в тексте и другие.

Первым пользователем новой версии продукта стало одно из подразделений ФАПСИ, использующее продукт для автоматической обработки потоков текстовых документов с целью последующей классификации.

С демонстрацией использования библиотеки можно познакомиться на сайте http://demo.rco.ru. На сайте http://www.rco.ru можно получить информацию о прочих разработках компании в рамках направления RCO.

вернуться



  Телефон: (495) 930-89-58/59

  Факс: (495) 930-88-14

  E-mail: info@metric.ru

Inoventica Разработка интернет-проектов. Создание многофункциональных решений - интернет-сайтов, интранет, экстанет систем, информационно-поисковых систем. Хостинг и аренда приложений. Размещение, поддержка, предоставление в аренду программного и аппаратного обеспечения.


© Группа компаний INOVENTICA | ООО "Гарант-Парк-Интернет", 1995-2011