Особенности

  • Исследование данных: 232 тыс. песен из Spotify в 26 жанрах + 15 функций анализа звука.
  • 26 жанров песен, классифицированных Spotify
  • R&B, хип-хоп, соул, электроника и т. д.
  • Подготовка данных: удалите ненужные жанры, измените тип данных и добавьте дополнительные столбцы.
  • Базовое распространение: саундтрек — 4,6%, инди — 4,5%
  • Чем больше функций, тем лучше — используется 15 функций.
  • После добавления дополнительных функций модель улучшается с 29,8% до 32,4%.
  • Удаление бинарной функции работает лучше
  • Точность без «явного»: 34,569% Точность с «явным»: 34,356%
  • Двоичная функция сделала Random Forest менее точным
  • Мы сохранили функцию «Явный»
  • Обучение модели — настройка гиперпараметров: оптимальная точка для n_estimator и max_depth
  • Окончательная точность обученной модели: 34,356%

Исследование данных: 232 тыс. песен из Spotify в 26 жанрах + 15 функций анализа звука.

  1. 26 жанров песен, классифицированных Spotify
  2. R&B, хип-хоп, соул, электроника и т. д.
  3. Общая информация о треке
  4. Имя исполнителя, популярность
  5. 15 функций анализа звука — расширенный анализ звука
  6. Описывает звуковые характеристики дорожки, такие как акустика, живость, тональность, темп и т. д.