Беседы о машинном обучении, которые меня волнуют, на mlcon 2.0

Масштабируемость является серьезной проблемой для обучения моделей, логических выводов и многого другого. Например, обучающая выборка может быть настолько большой, что подгонка модели может быть чрезмерно медленной. Задержка прогнозирования также может быть проблемой для различных приложений реального времени. Это всего лишь две из многих причин, по которым большинство проектов по машинному обучению не доходят до производства. Проблема заключается в том, что знания о машинном обучении часто доступны из разрозненных источников или вообще отсутствуют. Конференция mlcon 2.0 была начата для того, чтобы разрушить эти разрозненные концепции и упростить разработку реальных приложений ИИ. В mlcon ведутся доклады на такие темы, как масштабируемое машинное обучение, NLP и MLOps. Ниже приведены некоторые доклады о масштабируемом машинном обучении на mlcon, которые меня больше всего волнуют.

Измерение ценности жизненного цикла клиента с помощью машинного обучения

Пожизненная ценность (LTV) клиента является одним из ключевых отраслевых показателей, используемых для измерения ценности клиента, и обычно используется для привлечения, роста и удержания «правильных» или прибыльных клиентов в организации. Неха Гупта, старший менеджер ML/DS в LinkedIn, расскажет о том, как команда Linkedin по выходу на рынок использует машинное обучение для понимания и прогнозирования потребительской ценности путем создания единой масштабируемой платформы для поддержки всех показателей LTV Linkedin в различных компаниях. . Эта новая платформа привела к повышению точности моделей на 50–60% и существенно сократила время запуска/создания новых моделей/конвейеров данных.

Ускорение трансформаторов до 1 мс — до бесконечности и дальше! Джефф Будье

Немногие компании смогли внедрить большие и сложные модели Transformer в производство в больших масштабах. Основным узким местом является задержка прогнозов, которая может сделать большие развертывания дорогостоящими, а варианты использования в реальном времени непрактичными. В докладе Hugging Face будет подробно описан их подход к ускорению моделей машинного обучения Transformer за счет исследований и оптимизации оборудования, чтобы добиться задержки в 1 миллисекунду на обычном оборудовании и позволить любой компании развертывать эти большие языковые модели в своей производственной инфраструктуре в масштабе.

Демократизация разработки машинного обучения для поддержки нового поколения персонализации аудио в Spotify

Машинное обучение лежит в основе всего, что есть в Spotify, и обеспечивает персонализированный пользовательский интерфейс, предоставляя миллиардам поклонников возможность наслаждаться и вдохновляться артистами на платформе. Дивита Вохра, менеджер по продуктам AI/ML в команде платформы машинного обучения Spotify, расскажет о миссии и эволюции инфраструктуры машинного обучения, которая является основой для таких ориентированных на пользователя процессов, как Discover Weekly, Release Radar, и рекомендаций в вашем экран создания плейлиста. Divita проведет вас через конкретный вариант использования персонализации, архитектуру программного обеспечения, которая его поддерживает, и уроки, извлеченные из опыта поддержки инженеров машинного обучения, разрабатывающих и внедряющих решения машинного обучения в масштабе.

Структура показателей для обновлений моделей в системах рекомендаций по рекламе

Выбор подходящей метрики производительности является важной частью процесса машинного обучения, особенно для крупномасштабных систем. Ашим Датта, руководитель отдела исследований данных о качестве рекламы в Pinterest, расскажет о крупномасштабных рекомендательных системах, которые опираются на несколько моделей, оптимизирующих различные цели. Это связано с тем, что автономная оценка таких моделей с использованием таких показателей, как PR-AUC или Logloss, не всегда гарантирует результаты, которых надеется достичь рекомендательная система. Кроме того, использование отдельных онлайн-метрик, таких как CTR или затраченное время, для количественной оценки влияния обновления моделирования на рынок, который пытается создать ценность для нескольких заинтересованных сторон, не всегда достаточно. Доклад завершится рассказом о том, как Pinterest построила систему онлайн-метрик для оценки успеха более чем 100 обновлений моделирования в своей системе рекомендаций по рекламе.

Заключение

В этом сообщении в блоге были рассмотрены лишь некоторые из многих бесплатных докладов о машинном обучении mlcon, которые мне очень нравятся. Если вы пропустите интересующий вас доклад, не волнуйтесь! Все доклады будут доступны на youtube канале cnvrg вскоре после мероприятия!