Запачкайте руки, чтобы учиться.

Первым конкретным шагом, который я сделал в своем путешествии по науке о данных, была регистрация для получения онлайн-сертификата. Все шло гладко и легко. Я просто изучал основы. Через некоторое время я начал думать, что быть специалистом по данным - это легко. Я бы просто получил несколько таких сертификатов и начал бы искать работу. Я собрал эти сертификаты в кратчайшие сроки. Тогда угадайте, что?

Добро пожаловать в реальный мир!

Сертификаты хорошо научат вас основам. Они знакомят вас с областью науки о данных. Однако они определенно не меняют правила игры.

Стоит отметить, что я говорю о сертификатах, полученных при прохождении курсов MOOC. Те, которые требуют сдачи комплексного экзамена, например сертификаты AWS, находятся на другой странице.

Возвращаясь к нашему обсуждению, я перечислил 5 причин, по которым вам следует работать над проектами, а не собирать многочисленные сертификаты.

1. Сертификаты не предполагают достаточного «активного обучения»

Сертификаты не бросают вызов учащимся. Если вы обратите внимание на лекции и прочитаете материалы, вы легко сможете сдать оценочные экзамены. Они недостаточно сильно подталкивают вас, чтобы вы действительно усвоили темы. Если вы недостаточно хорошо думаете и не заставляете себя работать, информация останется в кратковременной памяти и будет забыта.

Как сказано в этой статье Ника Дама, изменения в нейронных связях, которые имеют фундаментальное значение для обучения, происходящего в мозгу, похоже, не происходят, когда процесс обучения не активен. Многие исследования показывают, что активное участие является предпосылкой изменений в мозге. Неудивительно, что просто прослушивание презентации или лекции не приведет к обучению .

Большую часть времени уходит на прослушивание лекций на курсах MOOC. С другой стороны, выполнение проектов - отличный пример активного обучения. Они призывают вас активно участвовать во всем процессе.

2. Не мыслить нестандартно.

Сертификаты предназначены для того, чтобы вы строго следовали учебной программе. Это действительно имеет смысл, потому что вы накапливаете знания от базовых до продвинутых. Однако карта нарисована за вас. Вам не нужно мыслить нестандартно. С другой стороны, нет карты или ограничений для проектов в области науки о данных. Вы можете определить проблему, разработать решение и реализовать его в любой сфере бизнеса. Я думаю, что это самая сложная часть работы специалиста по данным. Специалисты по обработке данных используют данные для решения проблем. В реальном мире на вашу тарелку не приходят ни проблемы, ни данные.

Конечно, важно и необходимо изучить инструменты и методы, которым можно научиться из сертификатов. Однако, если вы не можете создать ценность, используя эти инструменты и методы, в чем смысл их освоения? Чтобы создавать ценность, вам нужно мыслить нестандартно. Обдумывание идей проектов и их практическая реализация - это ваш путь к созданию ценности с помощью науки о данных. Сценарии использования, обсуждаемые в сертификатах, ограничены определенными доменами. Однако потенциальная ценность проектов в области науки о данных намного больше. Просто сосредоточение внимания на сертификатах мешает вам мыслить нестандартно.

3. Реальность полна сюрпризов.

Сертификаты охватывают только предсказуемые сценарии. Однако реальная жизнь полна сюрпризов. Невозможно или неосуществимо охватить все возможные препятствия в сертификате. Кроме того, они слишком длинные, чтобы подробно описывать все возможные решения или методики. Слишком длинный учебный план снизит вашу мотивацию, и, следовательно, коэффициент завершения будет очень низким.

Пройдя несколько курсов MOOC, я почувствовал себя мастером панд. Я знал все, что мне нужно для анализа данных с помощью pandas. Однако, когда я начал свой первый проект, мне казалось, что я стою в начальной точке долгого пути. Хотя это был простой вводный проект, я потратил очень много времени, повторяя следующие шаги.

  • Я столкнулся с проблемой
  • Начать искать решение
  • Узнавайте много нового в поисках решения
  • Найти решение

Проекты многому вас научат. Что еще более важно, радость, которую вы испытываете, когда проект завершен, мотивирует вас начать новый в кратчайшие сроки.

4. Данные не передаются вам на блюдечке с голубой каемочкой.

В большинстве сертификатов есть готовые данные. Данные чистые и красиво отформатированы. Иногда он содержит некоторые пропущенные значения, которые структурированы таким образом, чтобы с ними можно было легко справиться. В некоторых случаях вас просят выполнить базовую предварительную обработку. Тогда все готово!

Я не думаю, что это то, что происходит с большинством специалистов по данным. Вам нужно продумать весь путь обработки данных. Специалисту по анализу данных обычно нужны ответы на следующие вопросы:

  • Какие данные нужны?
  • Как его собрать?
  • Как его можно очистить и обработать?

Когда вы работаете над проектами, большая часть работы - это подготовка данных. Вы приобретете практический опыт сбора и подготовки данных, который является очень ценным навыком для специалистов по данным. Вы не можете улучшить этот навык, собирая сертификаты.

5. Осуществимость имеет значение

Сертификаты проведут вас через конвейер типичного проекта в области науки о данных от сбора данных до оценки модели. Вы можете создать модель для примера использования. Однако в этих сертификатах не обсуждается возможность реализации. Осуществимость так же важна, как и любой другой шаг проекта. Если ваше решение слишком сложно для реализации, оно бесполезно. Выполняя проекты, нужно также думать о целесообразности. Вы не только пытаетесь построить модель, но и ищете способы развернуть свою модель и создать на ее основе ценность. Возможно, вы слышали о конкурсе Netflix Prize на Kaggle с наградой в 1 миллион долларов. Netflix решил не реализовывать победившую модель, потому что это было невозможно. Когда вы занимаетесь независимыми проектами, вам фактически не нужно развертывать свои модели или запускать их в производство. Тем не менее, вы хотя бы продумаете осуществимость.

Заключение

Если вы только начинаете заниматься машинным обучением и хотите учиться с нуля, я сделаю эту серию, которая будет длиться 5–6 минут о машинном обучении и некоторых побочных проектах в конце каждой главы, так что оставайтесь с нами и довольны обучение

Это мое личное исследование, если у вас есть какие-либо комментарии, пожалуйста, свяжитесь со мной.

Добро пожаловать на мою среднюю страницу

Github, LinkedIn, Захра Эльхамрауи, Upwork