Машинное обучение всегда казалось мне вершиной науки о данных. Это была неуловимая концепция, которую полностью понимали только боги STEM. Но всего за третью неделю моего иммерсивного учебного курса по науке о данных на General Assembly я научился создавать прогностические модели с использованием методов машинного обучения. Я получаю гораздо лучшее представление о том, что это на самом деле, и я должен сказать, что это оказалось совсем другим, в частности, гораздо менее техническим, чем я ожидал.

Самая необычная часть этого буткемпа до сих пор заключалась в том, чтобы подогнать модель (то есть помочь машине «обучиться») с помощью двух строк кода. (1) Создание экземпляра и (2) подгонка. Конечно, перед этим вам, возможно, придется объявить некоторые переменные, но суть метода — две (2!) строки кода! Излишне говорить, что учиться было интересно. Внезапно мне показалось, что я способен проводить действительно сложный анализ и генерировать обоснованные прогнозы всего и вся. Всего за три недели!

Но мы только что завершили четвертую неделю, и я должен сказать, что начинаю понимать, что сложность создания модели просто иная, чем я ожидал. Конечно, я могу спрогнозировать цены на жилье, основываясь на широком спектре признаков, или попытаться угадать, у кого из пациентов есть заболевание почек, на основании показателей их жизнедеятельности, но можно ли обобщать мои прогнозы? Есть ли мультиколлинеарность среди моих переменных? Должен ли я добавить некоторые полиномиальные функции?

Все это говорит о том, что машинное обучение сложно. Но она не настолько сложна, чтобы быть недоступной для людей, специализирующихся в области политологии, таких как я, или для любого человека с любым образованием. Он сложен тем, что в нем есть творчество и эксперименты. Мне не нужно быть ученым-ракетчиком, мне просто нужна практика. И я очень жду :^)