Я немного подумал об этом (и просмотрел каждое сообщение типа «автогенерация тегов для контента» на StackOverflow).
У меня есть статья (body:string) с несколькими тегами (объединенными через теги).
Прямо сейчас в приложении, чтобы предложить теги для статьи, pgsearch ищет в основном тексте других статей текст, включенный в основной текст (основные слова в тексте), и предлагает теги на основе тегов этих связанных статей. Конечно, это работает только в том случае, если похожие статьи были отмечены тегами, и чем больше статей помечено тегами в базе данных, тем лучше теги для использования.
Есть ли более разумный способ, скажем, с помощью ElasticSearch, автоматически находить популярные слова из основного текста других статей (уникальные и с основами) и автоматически генерировать список этих тегов.
Если бы я сделал это сам, есть ли какие-нибудь примеры для эффективного выполнения этого?