Привет, мир! Вот и я, наконец, выполняю свое желание стать блоггером, особенно в области машинного обучения и глубокого обучения. Соответственно, это канун нового года. Пришло время начать с этого блога, не так ли?
В связи с достижениями в области искусственного интеллекта у моих коллег и студентов снова и снова возникает вопрос: «Как мне стать специалистом по анализу данных?». Фактически, согласно многочисленным отчетам, сейчас это одна из самых востребованных вакансий в мире.
Тем не менее, это дает пищу для размышлений о том, какие квалификации необходимы для работы в качестве специалиста по данным в ведущей ТНК? Большинство компаний в сфере I.T. В этом секторе, особенно тем, кто стремится стать лидером в области искусственного интеллекта, потребуется либо степень магистра в области аналитики, либо, желательно, докторская степень по статистике, информатике, математике и так далее. Можно специализироваться на одной или многих из перечисленных ниже тем в зависимости от того, что вам нравится.
- Структурированный анализ данных
- Обработка естественного языка (NLP)
- Компьютерное зрение (CV)
- Оптимизация
- Байесовские сети
- Глубокое обучение
Помимо специализации в одной из вышеуказанных областей, у вас также есть возможность выбрать область, в которой вы хотите использовать свои навыки в качестве специалиста по данным. Вот несколько:
- Розничная торговля
- Финансы
- Телеком
- Производство
- Здравоохранение
Конечно, есть много других областей, которые можно добавить к этому списку, но это самые прибыльные.
Стать специалистом по данным означает, что вам необходимо обладать обширными знаниями в области аналитики данных, а также хорошо разбираться в кодировании и понимании сложных математических задач. Подводя итог, вот несколько вещей, которые необходимо иметь, прежде чем вы решите сделать следующий шаг в своей карьере:
- Навыки программирования: Python / R (необходимо знание C ++)
- Основы математики, такие как исчисление, линейная алгебра, векторы и матрицы
- Основы машинного обучения
- Статистика и теория вероятностей
- Любые инструменты визуализации будут дополнительным преимуществом. Например. Tableau
Теперь, когда у вас есть представление о том, какие ключевые навыки необходимы для того, чтобы стать специалистом по анализу данных, давайте рассмотрим некоторые другие способы, которые могут помочь работающим людям повышать квалификацию, не уходя с работы:
- Сертификаты известных онлайн-образовательных сайтов, таких как Coursera, edx.org, Udacity (у них есть ряд программ Nanodegree), Udemy и т. Д.
- Возьмите тематические исследования в Kaggle.
- Создайте присутствие в Интернете. Следите за известными деятелями в области искусственного интеллекта в Твиттере и следите за последними тенденциями, официальными документами и публикациями.
- Направляйте свои мысли в статьи, блоги и т. Д.
- Имейте репозиторий github для публикации вашего кода, тематических исследований, над которыми вы работали, и т. Д. Некоторые компании попросят вас о том же.
- Начните решать проблемы кодирования на Leetcode или на Hacker-Rank. Лично я предпочитаю Leetcode.
Наконец, вот несколько советов, которые помогут найти работу в компании своей мечты:
- Получите рекомендацию через свои контакты, получите это интервью и взломайте его. (Конечно, подготовьтесь заранее)
- Подайте заявку на работу через LinkedIn.
- Участвуйте в хакатонах, предлагающих работу.
- Поддерживайте репозиторий Github с кодами и тематическими исследованиями, над которыми вы работали.
- Постарайтесь пройти стажировку в хорошей компании, много работайте и увлекайтесь тем же.
- Если у вас есть предыдущий опыт работы, попробуйте перейти в команду аналитики вашей компании. Получить перерыв в новой компании в качестве новичка может быть сложно, и шкала заработной платы также будет не такой высокой.
- Присоединяйтесь к стартапу.
Вы должны помнить одну вещь: в отличие от программной инженерии, Data Science является итеративной по своей природе, и вы не получите наилучших результатов с первого дня. Мой совет, не теряйте терпения, будьте готовы, пока не добьетесь успеха. Вы также должны иметь возможность измерять любые ошибки, с которыми вы сталкиваетесь в решениях, которые вы создаете, используя различные методы, такие как точность, прецизионность, отзыв, кривые ROC и т. Д. Эти методы будут различаться от модели к модели.
Еще одна важная вещь, которую нужно знать, - это то, что ML - это мусор на входе, мусор на выходе, поэтому размер и качество данных (тестовых / обучающих), которые вы используете, очень важны. Убедитесь, что вы уделяете достаточно времени получению правильных данных. Чрезвычайно важным шагом в создании решений с помощью машинного обучения является предварительная обработка данных. Это еще одно необходимое зло, с которым должен быть знаком каждый специалист по анализу данных. Только имея опыт, а главное - неудачи, вы научитесь.
И последнее, но не менее важное: полезный указатель: многие модели глубокого обучения являются моделями черного ящика, что означает, что они дают хорошие прогнозы, но не дают никакого представления о том, как был рассчитан результат. Поэтому вам нужно выбрать правильную модель на основе решения, над которым вы работаете.
На достижение всего вышеперечисленного у вас уйдет как минимум год (при условии, что вы учитесь 6–7 часов в день и не имеете предварительных знаний в области ИИ).
Специалисту по анализу данных также следует интересоваться вопросом «Почему?» фактор для каждой проблемы / решения. И ему / ей нужно иметь голод, чтобы изучать новые технологии и учиться на протяжении всей своей карьеры.
Я преподаю концепции машинного обучения и глубокого обучения в нескольких учреждениях. Не стесняйтесь обращаться ко мне по поводу занятий по выходным по любой / всем вышеперечисленным темам.
С Новым 2019 годом всех. Удачного обучения и надеемся вскоре увидеть, как вы станете специалистом по анализу данных!