От предварительной обработки до изучения категориальных вложений

Нейронные сети (NN) чаще всего используются при работе с естественными данными, такими как текст, речь или изображения. Они реже используются при работе с традиционными табличными данными. Однако они могут дать ряд преимуществ. Я исследую эту тему в новом видео, посвященном конкурсу Kaggle по обнаружению мошенничества с кредитными картами.

Во-первых, вы можете повысить производительность, объединив свою модель NN с более традиционными предсказаниями моделей на основе деревьев. Это эффективно, потому что, вероятно, НС научилась чему-то другому, и именно эта разница приводит к полезному ансамблированию. [Если вы хотите узнать больше об ансамбле, вы можете просмотреть мое видео по этой теме здесь.]

Далее, сами изученные вложения могут быть полезными для анализа. Например, на изображении выше мы построили 2D-проекцию полного внедрения транзакции. Это показывает интересную структуру с множеством кластеров. Анализируя эти кластеры, мы видим, какие транзакции, по мнению модели, похожи. Это может помочь нам создать новые функции, которые будут способствовать лучшему обучению.

Вы можете посмотреть видео здесь:

Чтобы получить больше подобного контента, вы можете подписаться на мой список рассылки на blog.zakjost.com