Лето 2018 года - когда я подхожу к концу второго года обучения, я решаю пройти стажировку, в основном посвященную разработке программного обеспечения на Python. Наука о данных как область науки не была для меня особенно новой, однако это определенно было чем-то, что я считал «не для моей лиги» или «не для меня». Одно из самых больших препятствий на пути к науке о данных - это ментальная блокировка, создаваемая нашими коллегами / старшими коллегами по поводу того, насколько сложной может быть область и математика, связанная с ней.

Важнейшей частью начала работы с любым полем является выбранный вами маршрут. Выберите неоптимальный маршрут, и вы легко сгоритесь или испугаетесь всей сложности концепций, которые вам навязывают. Прекратите учиться на неправильном этапе, и вы узнаете концепции только с поверхности, а не их реальную реализацию. Что происходит, так это то, как я решил эту проблему методом проб и ошибок, и это мое личное мнение - ваш опыт может отличаться.

Глядя на первоначальный ажиотаж, я сразу же решил вскочить на ажиотаж и начать со знаменитого курса машинного обучения, который преподает Эндрю Нг. Через четыре недели я испытываю стресс, просто глядя на математику, и вижу, как изо всех сил пытаюсь понять концепции. (Как вы, возможно, догадались, математика мне не очень нравится, отсюда и склонность к выбору курса, более ориентированного на приложения. Если вам нравится математика, вам может понравиться курс машинного обучения Эндрю Нг.)

Ошибка 1. Не начинайте с чего-то, что включает в себя много математики, есть большая вероятность, что вы сдадитесь или не поймете основную концепцию.

Два месяца спустя, во время летней стажировки, я начал изучать курс машинного обучения A-Z, который ведет Кирилл Еременко, и понял, что отдельные концепции не так уж сложны для понимания, и я могу это сделать. Позже я успел закончить все курсы от A до Z и был довольно уверен в своих навыках в этой области, учитывая, что я прошел 4 курса за 5 недель.

Ошибка 2 - Не переоценивайте свои способности.

Обладая всеми знаниями из 4 курсов, которые я прошел, я пошел дальше и попытался решить реальную проблему - попытаться обнаружить вредоносные URL-адреса. Покопавшись в сети, я обнаружил, что случайные леса - хороший подход к этой проблеме, и успешно реализовал базовую модель для решения проблемы в течение четырех-пяти дней. Здесь я впервые столкнулся с препятствием - настройка параметров.

Я ловлю себя на том, что настраиваю гиперпараметры для алгоритма случайного леса, как обезьяна, случайно поворачивающая ручки. Это было связано с множеством проб и ошибок, и когда все работало, я понятия не имел, как они работают.

Вот когда я решил, что пора мне узнать математику, лежащую в основе этого, чтобы быть действительно эффективным. Я сразу же начал курс машинного обучения и обнаружил, что действительно понимаю большую часть математики, которую раньше не понимал. Во многом я приписываю это тому факту, что со второй попытки я знал, где на самом деле применялись математические вычисления. Это дало мне достаточно мотивации, чтобы заняться специализацией deeplearning.ai и завершить ее тоже.

Как только вы закончите с этим, вы можете перейти к дальнейшим курсам продвинутого уровня в определенной области по вашему выбору. Отличным примером этого может быть такой курс, как CS231n, если вы интересуетесь компьютерным зрением и хотите больше узнать о CNN.

Ошибка 3 - Просто не продолжайте делать курсы!

Я считаю себя виноватым в совершении этой ошибки. Если вы продолжите изучать теорию без практического применения, многое из того, что вы узнали, не останется в памяти надолго. Начните с создания хороших побочных проектов - идеальным подходом может быть включение науки о данных в мини-проекты вашего колледжа, которые требуются большинству университетов для каждого курса, который вы изучаете в семестр. Таким образом, вы в конечном итоге зарабатываете пирожные, поскольку ваш проект будет выделяться среди остальных ваших коллег, а также поможет вам заполнить свое резюме при подаче заявки на стажировку позже!

TL; DR: Не начинайте с тяжелых курсов по математике. Курсы от А до Я, предлагаемые Кириллом Еременко, отлично подходят для начала, после чего вам следует перейти к пониманию математики.

Опять же, все упомянутое здесь является моим личным мнением, и ваш опыт может отличаться!