convertorannotator.txt
2008-01-12 12:03...
Описание convertorannotator: Автор -- Andrey Orlov Версия -- $Id: convertorannotator.txt 346 2006-11-13 20:04:11Z cray $ Аннотация: Этот конвертор предназначен для автоматического составления аннотации по тексту, на основе ключевых слов. Принцип работы: Пусть есть текст и список ключевых слов, тогда: - Текст разбивается на предложения (предполагается, что каждое предложение начинается с большой буквы и кончается точкой); - Ключевые слова нормируются - отбрасывается последние 20% слова; - Отыскать все предложения с ключевыми словами; - Каждому предложению ставится в соответствие ранг - количество ключевых слов встретившихся в предложении; - Предложения сортируются по рангу и номеру; - Отбираются первые 10ть предложений отсортированного списка; - Отобранные предложения сортируются в порядке возрастания номеров; - Отсортированные предложения объединяются в текст аннотации; Конвертор имеет параметры (IConvertorAnnotator): - Флаг "использовать нормирование ключевых слов"; - Целое число "длина аннотации" (количество предложений); - Список ключевых слов; Виды: edit -- Настройка параметров.