Мы проводим кластерный анализ, чтобы обнаружить группы элементов, которые имеют общие характеристики. Это распространенный тип неконтролируемого машинного обучения, который очень полезен и широко используется учеными для изучения сложных многомерных данных. Однако часто трудно найти правильную кластеризацию, потому что есть много алгоритмов и параметров на выбор.

Clustervision — это инструмент визуальной аналитики, который помогает специалистам по данным найти правильную кластеризацию среди большого количества доступных методов и параметров. Он запускает кластеризацию с использованием различных методов и параметров кластеризации и предоставляет ранжированный список результатов кластеризации на основе нескольких показателей качества. Пользователи могут исследовать результат кластеризации или сравнивать несколько результатов, используя несколько скоординированных представлений. Кроме того, пользователи могут предоставлять системе обратную связь, чтобы при следующем запуске она могла давать более релевантные результаты.

Недавно мы запустили веб-версию Clustervision. Пожалуйста, посмотрите и поиграйте с инструментом. Вы также можете загрузить свой набор данных, чтобы выполнить его кластеризацию и визуализировать результаты.

Нажмите на следующую ссылку, чтобы поиграть с инструментом:



Веб-система была разработана с использованием Python Flask, Javascript, D3.js и jQuery. Если вы хотите узнать больше о Clustervision, я рекомендую вам посмотреть мой доклад, статью и демонстрационное видео здесь:



У вас есть новые идеи, предложения или отзывы? Вы хотите использовать Clustervision для своих собственных наборов данных? Пожалуйста, не стесняйтесь делиться со мной своими мыслями и идеями.

  • Квон, Б.К., Эйзенбах, Б., Верма, Дж., Нг, К., Де Филиппи, К., Стюарт, В.Ф., и Перер, А. (2018). Clustervision: визуальный контроль неконтролируемой кластеризации. Транзакции IEEE по визуализации и компьютерной графике, 24(1), 142–151.