Нахождение в словаре отсутствующих слов
2007-11-13 23:54Наверно это очень сильно для самостоятельно реализации. Но вот какая проблема. Есть вики. Она индексируется и все ключевые слова на каждой странице известны. Если слова нет в словаре, то сейчас просто отображается страница о том, как создать такое слово. Хотя можно было бы перебрасывать на страницу со словом, наиболее похожим на данное. Ключевая проблема тут - похожесть. Есть два варианта:
- Два слова похожи в силу написания (ну, есть же в конце концов опечатки и т.п.), алгоритм индекса нужно искать в инете.
- Два слова похожи в силу того, что всречаются в одних и тех же статьях. Тут уже сингулярная декомпозия и прочая наука, как например придуманная мной когда-то категориальная нейросеть.