У меня был один сценарий, когда мне нужно было кластеризовать данные операционной системы. Фактические данные включают 151 пользователя, использующего Windows, 27 пользователей, использующих MAC, 5 пользователей, использующих Linux.
Один раз после кластеризации с помощью Carrot2 API с использованием Lingo3gClusteringAlgorithm. Получение результатов кластера, когда пользователи MAC OS 27, пользователи Linux 5 и, наконец, все пользователи Windows находятся в кластере других тем. Но было бы хорошо, если бы я выделил пользователей Windows в отдельный кластер. Итак, чтобы получить Windows как отдельный кластер, какие атрибуты кластеризации мне нужно настроить. В настоящее время используется только "combined-cluster-score-balance" со значением: 1,0. Любая помощь приветствуется