Недавно мы опубликовали первую статью, резюмируя наш недавний опрос по машинному обучению. Там мы говорили о некоторых результатах, например о том, какие языки программирования используют специалисты по машинному обучению, какие фреймворки они используют и какие области области их интересуют. Во второй из двух статей, резюмирующих этот обзор, мы хотим для обсуждения дополнительных результатов, таких как связанные навыки машинного обучения и проблемы с реализацией.
Какие из этих смежных навыков машинного обучения важны для вас?
Практики машинного обучения, как правило, делают больше, чем просто создают алгоритмы в течение всего дня. Как видно из диаграммы, возникли две основные темы. Во-первых, необходимо подготовить данные, т. е. основы инженерии данных. Практики машинного обучения часто работают с данными в начале и во время полного стека вещей, поэтому они видят много разработки рабочего процесса / конвейера, обработки данных и подготовки данных. Во-вторых, существует сильная тенденция рассказывания историй о данных, при этом коммуникативные навыки, анализ данных и визуализация данных являются обычными среди специалистов по машинному обучению.
Какой процент моделей машинного обучения, разработанных в вашей организации, развертывается в производственной среде?
По процентной шкале от 0% до 100% мы задали вопрос, сколько моделей машинного обучения действительно используется в производственной среде. Ответ был прост — чуть меньше 50%. Для тех, кто читает эту статью, какие блокираторы мешают развертыванию? Какие ключевые моменты приводят к развертыванию модели, которая может помочь предотвратить напрасную трату времени? Дайте нам знать!
Каковы самые большие проблемы в машинном обучении? (выберите все подходящие варианты)
В связи с предыдущим вопросом, вот несколько проблем, с которыми сталкивается машинное обучение. Некоторые из проблем вполне логичны, поскольку они связаны с качеством данных, при этом распространенными проблемами являются плохие/нечистые данные и предвзятость данных. Тем не менее, некоторые более мягкие проблемы, по-видимому, являются проблемой, такой как отсутствие связи между командами (часто между инженерами и руководством), отсутствие опыта в предметной области и неясные бизнес-цели.
С надеждой
Если вы хотите узнать больше о машинном обучении, посетите ODSC East 2023, где будет ряд сессий в рамках машинного и глубокого обучения, которые будут охватывать инструменты, стратегии, платформы, и варианты использования, которые вам нужно знать, чтобы преуспеть в этой области. Некоторые сеансы включают:
- Введение в обработку данных с помощью SQL
- Устойчивое машинное обучение
- Машинное обучение с XGBoost
- Идиоматические панды
- Введение в крупномасштабную аналитику с PySpark
- Программирование с данными: Python и Pandas
- Введение в машинное обучение
- Математика для науки о данных
- Использование науки о данных для лучшей оценки игроков в американский футбол
- Как создавать потрясающие веб-приложения для Data Science на Python — Taipy Tutorial
- К следующему поколению искусственного интеллекта и его практическим применениям
- Введение в AutoML: оптимизация гиперпараметров и поиск нейронной архитектуры
- Практическое руководство по созданию демонстраций машинного обучения с помощью Gradio
- Выявление поведенческих сегментов путем применения неконтролируемого обучения к данным о местоположении
- Помимо кредитного скоринга: гибридные модели скоринговых карт для обеспечения точности и интерпретируемости
- Расширенное повышение градиента (I): основы, интерпретируемость и категориальная структура
- Расширенное повышение градиента (II): калибровка, вероятностная регрессия и конформное прогнозирование
- Начало работы с оптимизацией гиперпараметров
- Создание рекомендаций на основе контента для миллионов продавцов и продуктов
- Модели машинного обучения для количественных финансов и торговли
Первоначально опубликовано на OpenDataScience.com
Читайте другие статьи по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от начального до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг. Вы также можете пройти обучение по науке о данных по запросу, где бы вы ни находились, с нашей платформой Ai+ Training. Подпишитесь также на нашу быстрорастущую публикацию на Medium, ODSC Journal, и узнайте, как стать писателем.