Недавно мы опубликовали первую статью, резюмируя наш недавний опрос по машинному обучению. Там мы говорили о некоторых результатах, например о том, какие языки программирования используют специалисты по машинному обучению, какие фреймворки они используют и какие области области их интересуют. Во второй из двух статей, резюмирующих этот обзор, мы хотим для обсуждения дополнительных результатов, таких как связанные навыки машинного обучения и проблемы с реализацией.

Какие из этих смежных навыков машинного обучения важны для вас?

Практики машинного обучения, как правило, делают больше, чем просто создают алгоритмы в течение всего дня. Как видно из диаграммы, возникли две основные темы. Во-первых, необходимо подготовить данные, т. е. основы инженерии данных. Практики машинного обучения часто работают с данными в начале и во время полного стека вещей, поэтому они видят много разработки рабочего процесса / конвейера, обработки данных и подготовки данных. Во-вторых, существует сильная тенденция рассказывания историй о данных, при этом коммуникативные навыки, анализ данных и визуализация данных являются обычными среди специалистов по машинному обучению.

Какой процент моделей машинного обучения, разработанных в вашей организации, развертывается в производственной среде?

По процентной шкале от 0% до 100% мы задали вопрос, сколько моделей машинного обучения действительно используется в производственной среде. Ответ был прост — чуть меньше 50%. Для тех, кто читает эту статью, какие блокираторы мешают развертыванию? Какие ключевые моменты приводят к развертыванию модели, которая может помочь предотвратить напрасную трату времени? Дайте нам знать!

Каковы самые большие проблемы в машинном обучении? (выберите все подходящие варианты)

В связи с предыдущим вопросом, вот несколько проблем, с которыми сталкивается машинное обучение. Некоторые из проблем вполне логичны, поскольку они связаны с качеством данных, при этом распространенными проблемами являются плохие/нечистые данные и предвзятость данных. Тем не менее, некоторые более мягкие проблемы, по-видимому, являются проблемой, такой как отсутствие связи между командами (часто между инженерами и руководством), отсутствие опыта в предметной области и неясные бизнес-цели.

С надеждой

Если вы хотите узнать больше о машинном обучении, посетите ODSC East 2023, где будет ряд сессий в рамках машинного и глубокого обучения, которые будут охватывать инструменты, стратегии, платформы, и варианты использования, которые вам нужно знать, чтобы преуспеть в этой области. Некоторые сеансы включают:

  • Введение в обработку данных с помощью SQL
  • Устойчивое машинное обучение
  • Машинное обучение с XGBoost
  • Идиоматические панды
  • Введение в крупномасштабную аналитику с PySpark
  • Программирование с данными: Python и Pandas
  • Введение в машинное обучение
  • Математика для науки о данных
  • Использование науки о данных для лучшей оценки игроков в американский футбол
  • Как создавать потрясающие веб-приложения для Data Science на Python — Taipy Tutorial
  • К следующему поколению искусственного интеллекта и его практическим применениям
  • Введение в AutoML: оптимизация гиперпараметров и поиск нейронной архитектуры
  • Практическое руководство по созданию демонстраций машинного обучения с помощью Gradio
  • Выявление поведенческих сегментов путем применения неконтролируемого обучения к данным о местоположении
  • Помимо кредитного скоринга: гибридные модели скоринговых карт для обеспечения точности и интерпретируемости
  • Расширенное повышение градиента (I): основы, интерпретируемость и категориальная структура
  • Расширенное повышение градиента (II): калибровка, вероятностная регрессия и конформное прогнозирование
  • Начало работы с оптимизацией гиперпараметров
  • Создание рекомендаций на основе контента для миллионов продавцов и продуктов
  • Модели машинного обучения для количественных финансов и торговли

Первоначально опубликовано на OpenDataScience.com

Читайте другие статьи по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от начального до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг. Вы также можете пройти обучение по науке о данных по запросу, где бы вы ни находились, с нашей платформой Ai+ Training. Подпишитесь также на нашу быстрорастущую публикацию на Medium, ODSC Journal, и узнайте, как стать писателем.