Здесь мы обсудим метод кластеризации, который объединяет не только образцы, но и функции из данных. Бумага, из которой взят контекст, в значительной степени полагается на алгоритмы разбиения графа на кластеры документов и слов.

Мы разработаем собственный код и позже сравним его с существующим модулем CoClustering, доступным в python (sklearn).

Репозиторий Github для алгоритма, который будет объяснен ниже: -
https://github.com/Darkprogrammerpb/DeepLearningProjects/tree/master/Project43/Spectral% 20Co% 20Кластеризация

Использованная литература:-

  1. Документация Sklearn
  2. Совместная кластеризация документов и слов с использованием разделения двудольного спектрального графа
  3. Нормализованные сокращения и сегментация изображений

PS: - Моя цель состояла в том, чтобы внести ясность в концепцию, насколько это возможно, понимая исходные коды и логику, изложенную в документах. Любые комментарии, улучшения и предложения всегда приветствуются. Я довольно олдскульный и склонен писать вещи на бумаге, прежде чем применять их где-нибудь, так что извините меня, если текстового содержания было меньше, а изображений было больше.