Я ищу алгоритм, который пытается проверить
1) сходство предложений (около 5000) друг с другом в документе
2) сходство нескольких документов (около 5000) по отношению друг к другу
Мне нужно то же самое, потому что я пытаюсь оценить, похожи ли текстовые документы/предложения, относящиеся к определенной категории, друг на друга. Существуют ли какие-либо существующие методы для того, чтобы сделать то же самое.