От СанитарЖеня Ответить на сообщение
К Novik Ответить по почте
Дата 10.12.2001 12:07:16 Найти в дереве
Рубрики Администрации; Версия для печати

Re: Специалистов по...

Факторный анализ здесь точно ни при чем, как и статмоделирование. Простейшее решение - на основании теоремы Байеса. Надо:
- встречаемость слов в текстах по рубрикам
- наличие слов-индикаторов в испытуемом тексте
- априорная вероятность отнесения текста к данной рубрике.

P(Ki|X)=P(X|Ki)*P(Ki)/(Sum(P(X|Kj)*P(Kj))
где
P(Ki|X) вероятность отнесения к i-той категории на основе наличия слов Х
P(X|Ki) вероятность наличия слов Х в i-той категории
P(Ki) встречаемость i-той категории