Эта статья изначально была опубликована в моем ML блоге.

Столько путаницы, столько сомнений и вопросов по поводу карьеры в ИИ! При выборе карьеры отсутствие ясности может быть очень напряженным. Вместо того, чтобы продолжать отвечать на отдельные вопросы, я решил ответить на них раз и навсегда. Разработка проекта ИИ включает в себя различные технические роли и задачи. Давайте демистифицируем их!

В этом посте мы рассмотрим следующее:

  1. Роли и задачи в проекте ИИ.
  2. Понимание тонкостей задач в жизненном цикле ИИ.
  3. Понимание тонкостей ролей в жизненном цикле ИИ.
  4. Области карьеры (кто нанимает на роли ИИ, отрасли ИИ и перспективы на будущее).
  5. Образовательные ресурсы.

1. Роли и задачи в проекте ИИ

Разработка проекта ИИ — это не подвиг одного человека. Он включает в себя различные различные задачи и роли. Это означает, что в команды ИИ входят люди, которые сосредоточены на отдельных частях жизненного цикла продукта:

Вот визуальное представление основных технических ролей и их связи с задачами в цикле разработки:

Legend: 
🟩 Primary tasks for that role. 
🟨 Secondary tasks: things they do at times; don't need to be proficient at them. 
🟥 Tasks not needed for that role.

Обратите внимание, что:

  • Точное количество ролей, необходимых для успешной работы команды ИИ, зависит от размера и масштаба проекта. Не во всех командах должны быть назначены люди на все вышеупомянутые технические роли. Например, очень часто командам ИИ не нужны штатные исследователи.
  • Кроме того, точные границы между этими ролями и задачами могут варьироваться от компании к компании. Например, в одних командах могут быть прикладные специалисты и специалисты по данным, а в других — инженеры машинного обучения и специалисты по данным; у некоторых могут быть и аналитики данных, и специалисты по данным, в то время как другие могут просто нанять специалистов по данным с сильной деловой хваткой и не нанимать аналитиков данных. Эти границы, как правило, размыты, особенно в стартапах.

Но сначала немного основ!

Прежде чем углубляться в дальнейшие детали, давайте быстро убедимся, что у нас есть четкое представление об основах:

2. Плюсы и минусы задач в жизненном цикле ИИ

я. Инжиниринг данных

Описание задачи. Подготовьте данные (входные данные из различных баз данных) и преобразуйте их в формат, который может быть легко использован другими участниками жизненного цикла ИИ, например аналитиками и специалистами по данным.

Требуемые навыки:навыки программирования и разработки программного обеспечения, спектр которых зависит от масштаба проекта.

Используемые инструменты:языки запросов к базам данных, такие как SQL, и объектно-ориентированные языки программирования, такие как Python, C# и Java. Также широко используются инструменты для работы с большими данными, такие как Apache Spark.

ii. Моделирование

Описание задачи. Ищите шаблоны в данных, чтобы помочь компаниям в принятии решений и/или автоматизировать процессы, в зависимости от варианта использования. Например, модель недвижимости можно использовать для прогнозирования продажных цен на дома, а модель компьютерного зрения можно использовать для автоматического обнаружения дефектных изделий во время производства.

Требуемые навыки: математика, наука о данных и машинное обучение.

Используемые инструменты: обычно используются Python, TensorFlow и PyTorch.

III. Развертывание

Описание задачи. Сделайте решение ИИ доступным для конечных пользователей — объедините данные с моделью и запустите комплексное решение в производство.

Требуемые навыки:сильные навыки кодирования и серверной инженерии для написания надежного и масштабируемого производственного кода.

Используемые инструменты: объектно-ориентированный язык программирования, такой как Python, C# и Java, и облачные технологии, такие как Azure и AWS.

IV. Бизнес-анализ

Описание задачи. Оцените производительность развернутых моделей и их влияние на бизнес. Например, данные о кликах пользователей можно использовать для оценки эффективности модели рекомендаций и понимания того, обеспечивает ли она ожидаемую ценность для бизнеса.

Требуемые навыки: деловая хватка, наука о данных для аналитики, сильные навыки общения и представления данных.

Используемые инструменты: инструменты для презентаций и анализа, такие как Excel, PowerPoint, Power BI и программное обеспечение для A/B-тестирования. Иногда могут потребоваться языки программирования, такие как Python.

в. Инфраструктура искусственного интеллекта

Описание задачи. Создайте и поддерживайте надежную, быструю, безопасную и масштабируемую программную инфраструктуру, чтобы задействовать все компоненты цикла разработки ИИ. Например, инфраструктура YouTube должна без проблем обрабатывать 5 миллиардов видеороликов каждый день!

Требуемые навыки: Сильные навыки разработки программного обеспечения.

Используемые инструменты: объектно-ориентированный язык программирования, такой как Python, Java или C#, и облачные технологии, такие как Azure и AWS.

VI. Исследования

Описание задачи. Глубокое погружение в конкретные области/проблемы исследований с целью улучшения текущего состояния дел, получение информации о последних разработках в этой области и публикация статей.

Требуемые навыки:сильное аналитическое и критическое мышление, навыки письма, настойчивость, сосредоточенность и многое другое!

Используемые инструменты: каналы, такие как академические публикации, Arxiv, Twitter и конференции, такие как NeurIPS, ICLR и ACM, чтобы оставаться в курсе событий. Python, PyTorch и/или TensorFlow для моделирования.

3. Плюсы и минусы ролей в жизненном цикле ИИ

я. Инженер-программист

Эта роль требует работы по обработке данных и работе с основной инфраструктурой. Это означает, что требуются сильные навыки кодирования и разработки программного обеспечения, такие как знание алгоритмов и распределенных систем.

ii. Специалист по данным

Эта роль требует работы над задачами обработки данных, моделирования и бизнес-анализа. Требуемый уровень навыков, например широта и глубина инженерных знаний и требуемая деловая хватка, зависит от общего состава команды (описание следующих нескольких ролей сделает это более понятным, особенно см. «Прикладной ученый против специалиста по данным») и масштаб проекта.

III. Инженер машинного обучения/ИИ

Эта роль требует выполнения задач по обработке данных, моделированию, развертыванию и инфраструктуре ИИ. Это универсальная роль, которую можно рассматривать как сочетание инженера-программиста и специалиста по данным с более сильными инженерными навыками, чем навыки работы с данными.

IV. Прикладной ученый

Эта роль является еще одним вариантом комбинации Инженер-программист + Наука о данных.

Инженер ML/AI против прикладного ученого. По сравнению с инженером ML/AI, прикладной ученый более силен в области науки о данных, чем в разработке программного обеспечения.

Ученый по данным и специалист по прикладным наукам.В командах, где есть и специалисты по данным, и специалисты по прикладным наукам, ученые-прикладники, как правило, имеют дело с более продвинутыми концепциями машинного обучения (глубокое обучение), в то время как специалисты по данным скорее всего, это люди с более сильной деловой хваткой.

в. Аналитик данных

Эта роль связана с работой над задачами обработки данных и бизнес-анализа. Однако, в отличие от других ролей, связанных с проектированием данных, аналитикам данных не нужны надлежащие навыки программирования и разработки программного обеспечения — их задачи могут быть выполнены с использованием языков запросов, таких как SQL, и интерактивных инструментов, таких как Power BI и Excel (см. «необходимые навыки и используемые инструменты» в разделе «Бизнес-анализ» для получения подробной информации).

VI. Исследователь AI/ML

Исследователи в значительной степени сосредоточены на моделировании, используя свои сильные научные навыки. Они работают над улучшением существующих современных моделей. В отраслевых условиях они предоставляют рекомендации другим участникам цикла разработки ИИ, таким как специалисты по данным и прикладным ученым, о том, как улучшить текущие решения и внедрить инновации с использованием ИИ.

4. Карьерные домены

а. Кто нанимает на роли ИИ

Технологические гиганты, такие как Microsoft, Google, Amazon, Facebook, Netflix, IBM, Uber и другие, являются лучшими местами для работы в этой области, потому что помимо работы над передовыми технологиями вы приступить к работе над продуктами, которые напрямую влияют на миллиарды конечных пользователей:

Cortana, Alexa, Google Translator, Power Point Designer, Smart Reply и Smart Compose в Outlook и Gmail, рекомендации YouTube и Netflix, распознавание лиц, люди, которых вы можете знать, страницы, которые вам могут понравиться, оценки доставки еды, предложения друзей, лента Рейтинг, и этот список можно продолжать и продолжать.

Однако приложения ИИ настолько разнообразны, что почти каждая отрасль в настоящее время использует ИИ и нанимает таланты в своей вертикали. Давайте посмотрим на некоторые менее очевидные области и их использование ИИ:

  • Финансы. Обнаружение мошенничества, прогнозирование и выполнение сделок на скорости и в таких объемах, с которыми люди не могут конкурировать.
  • Медицина: медицинская диагностика, открытие лекарств, понимание факторов риска заболеваний у больших групп населения, экспертные системы для помощи врачам общей практики, мониторинг и контроль в отделениях интенсивной терапии, проектирование протезов.
  • Робототехника: контроль зрения, управление моторикой, обучение, совместное поведение.
  • Инжиниринг: диагностика неисправностей, профилактическое обслуживание, интеллектуальные системы управления, интеллектуальные производственные системы.
  • Маркетинг: более целенаправленные, актуальные и своевременные маркетинговые программы.
  • Онлайн-поддержка клиентов: чат-боты заменят представителей службы поддержки.
  • Космос: НАСА использует искусственный интеллект, чтобы планировать техническое обслуживание космических челноков.
  • Военные действия: сюда поступает огромный приток средств, но подробности являются секретной информацией!

б. Филиалы ИИ

Как видно из приведенных выше примеров, приложения ИИ могут быть самыми разнообразными. Чтобы лучше это проиллюстрировать, вот обзор ветвей ИИ:

Кроме того, вот несколько полезных советов от McKinsey Research, которые помогут вам узнать, за какими отраслями следует следить:

5. Учебные ресурсы

На этом этапе вы должны были сузить список инструментов и навыков для желаемой роли. С этого момента вы сможете найти множество соответствующих ресурсов, таких как:

  • Курсы, буткемпы и сертификаты
  • Книги
  • Блоги

Книга Рекомендации

Онлайн-курсы

Вот несколько отличных онлайн-курсов и специализаций:

Для углубленного изучения машинного и глубокого обучения я настоятельно рекомендую курсы Эндрю Нг (профессор Стэнфордского университета) на Coursera:

Помимо Coursera, fast.ai также является отличным местом для изучения глубокого обучения.

Для изучения Науки о данных в Python в веселой и интерактивной форме, вот очень любимый вами курс! :)

Само собой разумеется, что есть тонны ресурсов там. Если вы хотите, чтобы я предоставил дополнительные рекомендации (книги/блоги/курсы) в какой-то конкретной области, сообщите мне об этом в комментариях.

Последние мысли

ИИ — относительно новая и быстро развивающаяся область, поэтому понятно, что вокруг много путаницы. Я надеюсь, что это краткое, но всестороннее руководство оказалось вам полезным, и вы уйдете с более четкой картиной того пути, которым вы хотите следовать. Опять же, пожалуйста, прочитайте описание вакансии и проведите небольшое исследование о компании/команде, на которую вы претендуете, чтобы понять, к какой роли (ролям) относится их описание — не полагайтесь только на название.

Такую разбивку не легко найти, поэтому, если вы нашли этот пост полезным, поделитесь им в своей сети, чтобы помочь мне связаться с теми, кому он будет полезен. также. Спасибо!

И последнее, но не менее важное: помните, что независимо от того, какой путь вы выберете, самое главное, чтобы выбор карьеры отражал ваши ценности.

Удачи в предстоящем путешествии!

P.S. Помимо моего блога, я регулярно публикую интересный контент, связанный с ИИ и инженерией, на LinkedIn. Если вас интересуют короткие еженедельные уроки, вы можете следовать за мной!

использованная литература