Я хочу определить сходство содержания двух новостей, похожих на новости Google, но разных в том смысле, что я хочу иметь возможность определить, каковы основные темы, а затем определить, какие темы связаны.
Итак, если статья была о Саддаме Хусейне, то алгоритм мог бы порекомендовать что-то о деловых отношениях Дональда Рамсфелда в Ираке.
Если вы можете просто разбросать ключевые слова, такие как k-ближайшие соседи, и небольшое объяснение того, почему они работают (если вы можете), я проведу остальную часть исследования и настрою алгоритм. Просто ищу место для начала, так как я знаю, что кто-то там, должно быть, пробовал что-то подобное раньше.