Мое путешествие в качестве специалиста по данным

Я проработал в должности Data Scientist 1,5 года и хотел бы поделиться своим общим опытом и знаниями со всеми вами.

Позвольте мне сначала кратко рассказать о моем прошлом. Мой профессиональный путь до того, как я попал в область науки о данных, был немного нетехническим (да, вы правильно поняли !!). Я закончил бакалавриат по информатике, но затем работал в технологии SAP, получил степень магистра в области управленческой информационной системы, где я изучал и создавал проекты, связанные с аналитикой данных, которые помогли мне воспользоваться этой возможностью.

С моей точки зрения, Data Science - это комбинация множества небольших специализированных областей:

· Общая разработка программного обеспечения: для коммерциализации алгоритма

· Алгоритм моделирования машинного обучения: для определения правильного подхода и разработки индивидуального алгоритма

· Математика (линейная алгебра, статистика): чтобы понять исследовательские работы и математику, лежащую в основе различных подходов к моделированию и встроенных методов, используемых в таких языках, как Python, R MATLAB

· Анализ данных: для визуализации данных и получения содержательной информации

· Навыки программирования, связанные с наукой о данных: для эффективного построения моделей на различных аналитических языках / инструментах, таких как Python, R или MATLAB. Также требуется на стадии прототипа или стадии производства.

Сначала это действительно страшно, и вы можете почувствовать себя совершенно потерянным (я все еще чувствую это довольно часто), но поверьте мне, просто продолжайте работать, верьте, и все станет на свои места одно за другим.

Как специалист по данным, мой жизненный цикл проекта состоит из многих фаз:

· Исследование: он предполагает чтение множества статей, исследовательских работ и обсуждение с коллегами.

· Завершить алгоритмическое решение: Завершить, если какой-либо из готовых алгоритмов может быть применен для данной проблемы, или разработать индивидуальный алгоритм, используя знания, полученные на 1-м этапе

· Прототипирование: реализация прототипной версии завершенного алгоритма в качестве 1-го шага для проверки решения.

· Тестирование: следует проводить много тестов с несколькими наборами данных, чтобы получить идеальное представление об алгоритме.

· Коммерциализация: внедрить и протестировать его в производственной среде.

Ниже приведен список, который я испытал, наблюдал и усвоил за свой крошечный 1,5-летний опыт:

1) Требуется огромное количество терпения

2) Настойчивость - ключ к успеху

3) Нужно много самомотивировать, так как здесь мы не можем рассчитывать на быстрый результат. Это может занять очень много времени (МЕСЯЦЕВ или ГОДОВ)

4) Регулярное чтение и обучение

5) Исчерпывающий процесс, необходимый для перемещения туда и обратно, поскольку для него нет единого решения и ссылки «StackOverflow»: /

6) Переведите техническую / математическую работу на простой / непрофессиональный язык во время презентации, чтобы слушатели чувствовали себя вовлеченными. Для меня это НАИБОЛЕЕ важное качество, которым должен обладать специалист по данным, и, на самом деле, это самая сложная вещь.

7) Очень важно держать менеджеров в курсе результатов исследовательской работы, чтобы они могли обрести уверенность в нашей работе и почувствовать себя вовлеченными. Кроме того, их видение бизнеса поможет нам держать нашу работу в правильных рамках.

8) Если вы не получили ожидаемого результата, не расстраивайтесь и не теряйте уверенность. Это нормально в любой исследовательской работе.

Я надеюсь, что мой опыт и знания так или иначе помогут вам. Вы не одиноки в этих американских горках: D Давайте продолжать двигаться вперед и наслаждаться !!

Прокомментируйте, если у вас есть какой-либо обычный или новый опыт. Давайте делиться и учиться друг у друга.