Автор Рёхей Фудзимаки

AutoML делает ИИ более доступным за счет автоматизации сложных ручных процессов обработки данных. Но есть предостережения к его использованию. Вот 5 основных мифов и фактов об AutoML.

По мере того как компании во всем мире расширяют усилия в области ИИ и машинного обучения (МО), одной из ключевых проблем является поиск талантов в области ИИ. Большинство средних и крупных предприятий обнаруживают, что нанимать группы по анализу данных дорого, особенно в трудные экономические времена.

Специалисты по данным обычно работают в нескольких компаниях из списка Fortune 500, и нанять таких специалистов по данным недоступно для большинства предприятий. Для проектов по науке о данных требуется междисциплинарная команда специалистов по данным, инженеров машинного обучения, архитекторов программного обеспечения, аналитиков бизнес-аналитики и профильных экспертов. Учитывая разнообразие проектов по науке о данных и требуемый значительный объем манипуляций с данными, создание и удержание команды такого типа является сложной задачей. Как современные предприятия могут решить эти проблемы и масштабировать свои операции по обработке данных? Как компании с развитой практикой BI могут использовать последние достижения в области технологий для расширения прогнозной аналитики?

Вот где в игру вступает автоматизированное машинное обучение (AutoML). Решения AutoML делают ИИ более доступным для всех за счет автоматизации сложных ручных процессов обработки данных. Предоставляя гражданским специалистам по данным передовые аналитические инструменты, компании могут воспользоваться преимуществами новых технологий. Эти гражданские специалисты по данным могут преодолеть разрыв в навыках, решить проблему нехватки рабочей силы и позволить компаниям использовать существующие ресурсы, которые у них уже есть. Специалисты по бизнес-аналитике и бизнес-аналитике могут использовать платформы AutoML для внедрения прогностической и предписывающей аналитики для получения глубоких знаний, предоставления бизнес-лидерам возможности принимать решения с помощью аналитики в реальном времени и оптимизировать эффективность бизнеса на основе данных.

Платформы AutoML первого поколения, также известные как AutoML 1.0, были сосредоточены на автоматическом построении и проверке моделей. Эти традиционные платформы автоматизируют только компонент машинного обучения процесса. Несмотря на свою полезность, платформы AutoML 1.0 не оказывают никакого влияния на наиболее трудоемкую и сложную часть процесса обработки данных — подготовку данных и разработку функций. Платформы следующего поколения, также известные как AutoML 2.0, включают сквозную автоматизацию. Они могут делать гораздо больше — от подготовки данных, разработки функций до создания и развертывания моделей в производственной среде. Эти новые платформы помогают командам разработчиков сократить время, необходимое для создания и развертывания моделей машинного обучения, с месяцев до дней. Платформы AutoML 2.0 учитывают сотни вариантов использования и значительно ускоряют инициативы корпоративного ИИ, делая разработку ИИ/МО доступной для разработчиков бизнес-аналитики и инженеров данных, а также ускоряя работу специалистов по данным.

Каждая новая технология, особенно в первые дни, имеет свою долю неправильных представлений, заблуждений и двусмысленности. Вот пять основных мифов и фактов об AutoML:

  • Объединение выбора функций с созданием функций. Разработка функций (FE) может подразумевать множество различных вещей, таких как создание функций вручную, выбор функций и извлечение функций. Разработка признаков — наиболее итеративный, трудоемкий и ресурсоемкий процесс, требующий междисциплинарного опыта. Это требует технических знаний, но, что более важно, знаний предметной области. Команда специалистов по данным создает функции, работая с экспертами в предметной области, проверяя гипотезы, создавая и оценивая модели машинного обучения и повторяя процесс до тех пор, пока результаты не станут приемлемыми для бизнеса. На самом деле FE включает в себя изучение функций, создание и выбор лучших функций с использованием реляционных, транзакционных, временных, геолокационных или текстовых данных в нескольких таблицах. Традиционные платформы AutoML требуют, чтобы группы специалистов по обработке и анализу данных создавали функции вручную, а это очень трудоемкий процесс, требующий обширных знаний предметной области. Платформы AutoML 2.0 предоставляют FE на базе ИИ, который позволяет любому пользователю автоматически создавать нужные функции, тестировать гипотезы и быстро выполнять итерации. Автоматизация FE решает самую большую проблему в науке о данных.

Подробнее читайте на RTInsights.com.