Особенности
- Исследование данных: 232 тыс. песен из Spotify в 26 жанрах + 15 функций анализа звука.
- 26 жанров песен, классифицированных Spotify
- R&B, хип-хоп, соул, электроника и т. д.
- Подготовка данных: удалите ненужные жанры, измените тип данных и добавьте дополнительные столбцы.
- Базовое распространение: саундтрек — 4,6%, инди — 4,5%
- Чем больше функций, тем лучше — используется 15 функций.
- После добавления дополнительных функций модель улучшается с 29,8% до 32,4%.
- Удаление бинарной функции работает лучше
- Точность без «явного»: 34,569% Точность с «явным»: 34,356%
- Двоичная функция сделала Random Forest менее точным
- Мы сохранили функцию «Явный»
- Обучение модели — настройка гиперпараметров: оптимальная точка для n_estimator и max_depth
- Окончательная точность обученной модели: 34,356%
Исследование данных: 232 тыс. песен из Spotify в 26 жанрах + 15 функций анализа звука.
- 26 жанров песен, классифицированных Spotify
- R&B, хип-хоп, соул, электроника и т. д.
- Общая информация о треке
- Имя исполнителя, популярность
- 15 функций анализа звука — расширенный анализ звука
- Описывает звуковые характеристики дорожки, такие как акустика, живость, тональность, темп и т. д.