2008-01-12

convertorannotator.txt

  2008-01-12 12:03

...

Описание convertorannotator:

  Автор -- Andrey Orlov
  
  Версия -- $Id: convertorannotator.txt 346 2006-11-13 20:04:11Z cray $

  Аннотация: 
  
    Этот конвертор предназначен для автоматического составления аннотации по тексту, на основе ключевых слов.
  
  Принцип работы:
  
    Пусть есть текст и список ключевых слов, тогда:  

        - Текст разбивается на предложения (предполагается, что каждое
          предложение начинается с большой буквы и кончается точкой);

        - Ключевые слова нормируются - отбрасывается последние 20% слова;

        - Отыскать все предложения с ключевыми словами;

        - Каждому предложению ставится в соответствие ранг - количество
          ключевых слов встретившихся в предложении;

        - Предложения сортируются по рангу и номеру;

        - Отбираются первые 10ть предложений отсортированного списка;

        - Отобранные предложения сортируются в порядке возрастания номеров;

        - Отсортированные предложения объединяются в текст аннотации;

    Конвертор имеет параметры (IConvertorAnnotator):

        - Флаг "использовать нормирование ключевых слов";

        - Целое число "длина аннотации" (количество предложений);
        
        - Список ключевых слов;

    Виды:
    
        edit -- Настройка параметров.

    
Официальный сайт Zope3 Московская группа изучения реактивного движения The Dream Bot Site noooxml