Структура многомерных данных

Хороший пост. Я хотел бы узнать мнение вашего эксперта о следующих инструментах, которые я лично использую для понимания многомерных данных:

  • анализ множественных соответствий, предпочтительно в сочетании с иерархической кластеризацией для отображения и визуализации корреляций и, возможно, зависимостей;
  • Изучение байесовской структуры, в частности, с помощью поиска Табу и деревьев Чоу-Лю, в основном рассматривая результирующие неориентированные графы (с ребрами, лишенными стрелок).

Насколько я понимаю, один интересный вывод из вашей статьи заключается в том, что коллайдеры и, в более общем плане, многофакторные влияния являются главной проблемой для прогнозирования и причинно-следственного анализа. Многие базовые статистические методы и методы машинного обучения основаны на предположениях о независимых (таким образом, линейно комбинируемых) влияниях. В частности, это логистические и простые регрессионные меры. Это, вероятно, объясняет, почему глубокое обучение может быть таким успешным, открывая иерархии нелинейно комбинированных влияний…