Несмотря на то, что в последнее время мой график был очень загружен, мне удалось получить серебряную медаль (5% лучших мест) в этом соревновании. Я действительно боролся, потому что делал это один, а это означало, что мне приходилось совмещать весь конвейер соревнований с другими обязательствами / работой. Но я рад, что усилия в конце концов окупились. :)

Однако я чувствовал, что могу лучше. Я расскажу подробнее, когда объясню некоторые из методологий, которые я использовал в этом соревновании, в другом посте. В то же время я совершил дорогостоящую ошибку: не выбрал лучший вариант. К счастью, это не стоило мне больших затрат.

Я определенно более предприимчив в этом соревновании, используя больше инструментов (LibFM, а также Keras). Но из-за нехватки времени/ресурсов я не могу сделать все, что запланировал.

Кстати, стоимость этой серебряной медали довольно высока. Глядя на то, сколько стоит AWS, я заработал…

Большую часть времени я использую t2.2xlarge, так как, на мой взгляд, это самый экономичный экземпляр. (Если у вас, ребята, есть варианты лучше/дешевле, поделитесь со мной!) Если я получаю ошибку памяти или мне нужно какое-то крупное оружие (например, GPU), я буду использовать c5.4xlarge (вычисление), r4.2xlarge ( память) или g3.4xlarge (дешевая видеокарта).

В заключение, это, безусловно, соревнование, очень интенсивное и веселое. Я определенно узнал больше о кредитном скоринге. Оглядываясь назад, я определенно должен использовать все переменные в данных, что должно дать более сильную модель. Я опубликую уникальные стратегии, которые я использовал, в другом посте, как только я все проясню и очистю.