Привет, мир! Вот и я, наконец, выполняю свое желание стать блоггером, особенно в области машинного обучения и глубокого обучения. Соответственно, это канун нового года. Пришло время начать с этого блога, не так ли?

В связи с достижениями в области искусственного интеллекта у моих коллег и студентов снова и снова возникает вопрос: «Как мне стать специалистом по анализу данных?». Фактически, согласно многочисленным отчетам, сейчас это одна из самых востребованных вакансий в мире.

Тем не менее, это дает пищу для размышлений о том, какие квалификации необходимы для работы в качестве специалиста по данным в ведущей ТНК? Большинство компаний в сфере I.T. В этом секторе, особенно тем, кто стремится стать лидером в области искусственного интеллекта, потребуется либо степень магистра в области аналитики, либо, желательно, докторская степень по статистике, информатике, математике и так далее. Можно специализироваться на одной или многих из перечисленных ниже тем в зависимости от того, что вам нравится.

  1. Структурированный анализ данных
  2. Обработка естественного языка (NLP)
  3. Компьютерное зрение (CV)
  4. Оптимизация
  5. Байесовские сети
  6. Глубокое обучение

Помимо специализации в одной из вышеуказанных областей, у вас также есть возможность выбрать область, в которой вы хотите использовать свои навыки в качестве специалиста по данным. Вот несколько:

  1. Розничная торговля
  2. Финансы
  3. Телеком
  4. Производство
  5. Здравоохранение

Конечно, есть много других областей, которые можно добавить к этому списку, но это самые прибыльные.

Стать специалистом по данным означает, что вам необходимо обладать обширными знаниями в области аналитики данных, а также хорошо разбираться в кодировании и понимании сложных математических задач. Подводя итог, вот несколько вещей, которые необходимо иметь, прежде чем вы решите сделать следующий шаг в своей карьере:

  • Навыки программирования: Python / R (необходимо знание C ++)
  • Основы математики, такие как исчисление, линейная алгебра, векторы и матрицы
  • Основы машинного обучения
  • Статистика и теория вероятностей
  • Любые инструменты визуализации будут дополнительным преимуществом. Например. Tableau

Теперь, когда у вас есть представление о том, какие ключевые навыки необходимы для того, чтобы стать специалистом по анализу данных, давайте рассмотрим некоторые другие способы, которые могут помочь работающим людям повышать квалификацию, не уходя с работы:

  1. Сертификаты известных онлайн-образовательных сайтов, таких как Coursera, edx.org, Udacity (у них есть ряд программ Nanodegree), Udemy и т. Д.
  2. Возьмите тематические исследования в Kaggle.
  3. Создайте присутствие в Интернете. Следите за известными деятелями в области искусственного интеллекта в Твиттере и следите за последними тенденциями, официальными документами и публикациями.
  4. Направляйте свои мысли в статьи, блоги и т. Д.
  5. Имейте репозиторий github для публикации вашего кода, тематических исследований, над которыми вы работали, и т. Д. Некоторые компании попросят вас о том же.
  6. Начните решать проблемы кодирования на Leetcode или на Hacker-Rank. Лично я предпочитаю Leetcode.

Наконец, вот несколько советов, которые помогут найти работу в компании своей мечты:

  1. Получите рекомендацию через свои контакты, получите это интервью и взломайте его. (Конечно, подготовьтесь заранее)
  2. Подайте заявку на работу через LinkedIn.
  3. Участвуйте в хакатонах, предлагающих работу.
  4. Поддерживайте репозиторий Github с кодами и тематическими исследованиями, над которыми вы работали.
  5. Постарайтесь пройти стажировку в хорошей компании, много работайте и увлекайтесь тем же.
  6. Если у вас есть предыдущий опыт работы, попробуйте перейти в команду аналитики вашей компании. Получить перерыв в новой компании в качестве новичка может быть сложно, и шкала заработной платы также будет не такой высокой.
  7. Присоединяйтесь к стартапу.

Вы должны помнить одну вещь: в отличие от программной инженерии, Data Science является итеративной по своей природе, и вы не получите наилучших результатов с первого дня. Мой совет, не теряйте терпения, будьте готовы, пока не добьетесь успеха. Вы также должны иметь возможность измерять любые ошибки, с которыми вы сталкиваетесь в решениях, которые вы создаете, используя различные методы, такие как точность, прецизионность, отзыв, кривые ROC и т. Д. Эти методы будут различаться от модели к модели.

Еще одна важная вещь, которую нужно знать, - это то, что ML - это мусор на входе, мусор на выходе, поэтому размер и качество данных (тестовых / обучающих), которые вы используете, очень важны. Убедитесь, что вы уделяете достаточно времени получению правильных данных. Чрезвычайно важным шагом в создании решений с помощью машинного обучения является предварительная обработка данных. Это еще одно необходимое зло, с которым должен быть знаком каждый специалист по анализу данных. Только имея опыт, а главное - неудачи, вы научитесь.

И последнее, но не менее важное: полезный указатель: многие модели глубокого обучения являются моделями черного ящика, что означает, что они дают хорошие прогнозы, но не дают никакого представления о том, как был рассчитан результат. Поэтому вам нужно выбрать правильную модель на основе решения, над которым вы работаете.

На достижение всего вышеперечисленного у вас уйдет как минимум год (при условии, что вы учитесь 6–7 часов в день и не имеете предварительных знаний в области ИИ).

Специалисту по анализу данных также следует интересоваться вопросом «Почему?» фактор для каждой проблемы / решения. И ему / ей нужно иметь голод, чтобы изучать новые технологии и учиться на протяжении всей своей карьеры.

Я преподаю концепции машинного обучения и глубокого обучения в нескольких учреждениях. Не стесняйтесь обращаться ко мне по поводу занятий по выходным по любой / всем вышеперечисленным темам.

С Новым 2019 годом всех. Удачного обучения и надеемся вскоре увидеть, как вы станете специалистом по анализу данных!