|
От
|
СанитарЖеня
|
|
К
|
Novik
|
|
Дата
|
10.12.2001 12:07:16
|
|
Рубрики
|
Администрации;
|
|
Re: Специалистов по...
Факторный анализ здесь точно ни при чем, как и статмоделирование. Простейшее решение - на основании теоремы Байеса. Надо:
- встречаемость слов в текстах по рубрикам
- наличие слов-индикаторов в испытуемом тексте
- априорная вероятность отнесения текста к данной рубрике.
P(Ki|X)=P(X|Ki)*P(Ki)/(Sum(P(X|Kj)*P(Kj))
где
P(Ki|X) вероятность отнесения к i-той категории на основе наличия слов Х
P(X|Ki) вероятность наличия слов Х в i-той категории
P(Ki) встречаемость i-той категории