Еженедельный информационный бюллетень, в котором обсуждаются важные исследовательские работы по машинному обучению, интересные технические выпуски, деньги, полученные от ИИ, и реальные реализации.

Sequence Scope - это сводка наиболее важных опубликованных исследовательских работ, опубликованных новостей о технологиях и стартапах в экосистеме ИИ за последнюю неделю. Этот сборник является частью информационного бюллетеня TheSequence. Специалисты по обработке данных, ученые и разработчики из Microsoft Research, Intel Corporation, Linux Foundation AI, Google, Lockheed Martin, Кардиффского университета, Колледжа наук Меллона, Варшавского технологического университета, Политехнического университета Валенсии и других компаний. и университеты уже подписаны на TheSequence.



📝 От редакции: Построение машинного обучения с помощью машинного обучения: миф или реальность?

Поиск нейронной архитектуры (NAS) и автоматизированное машинное обучение (AutoML) - одни из самых горячих областей исследований в области искусственного интеллекта (AI). NAS и AutoML основаны на обещании использования методов машинного обучения для автоматизации создания моделей машинного обучения для данной проблемы. Такие платформы, как Google Cloud и Microsoft Azure, включили возможности NAS и AutoML как часть своих служб машинного обучения. Идея кажется слишком хорошей, чтобы быть правдой. Можем ли мы сделать так, чтобы машинное обучение работало за нас? Ответ - ДА, но нам также нужна контрольная точка реальности.

Такие дисциплины, как NAS и AutoML, определенно будут играть важную роль в следующем десятилетии решений для машинного обучения, но сегодня предстоит еще много работы. Хотя возможности NAS и AutoML можно найти в основных фреймворках и платформах машинного обучения, их использование по-прежнему ограничено базовыми сценариями использования. Большинство методов NAS или AutoML не подходят для более сложных сценариев обработки данных, требующих сложной архитектуры нейронных сетей. Несмотря на то, что исследования показывают многообещающие, вам необходимо протестировать один из этих методов в реальных сценариях, чтобы понять его ограничения. Однако сообщество машинного обучения продолжает уверенно развиваться. Буквально на этой неделе Microsoft Research представила открытый исходный код проекта, который объединяет некоторые из лучших методов NAS в рамках общей модели программирования. Короче говоря, методы NAS и AutoML определенно следует учитывать в ваших проектах машинного обучения, но пока не стоит ожидать от них слишком многого.

Как ты думаешь? Насколько машинное обучение способно автоматизировать создание моделей машинного обучения?

🔺🔻 TheSequence Scope - наше воскресное издание с обзором развития отрасли - бесплатно. Чтобы получать высококачественный образовательный контент каждый вторник и четверг, подпишитесь на TheSequence Edge 🔺🔻

🗓 На следующей неделе в TheSequence Edge:

Грань № 27: концепция контрастирующего обучения; Исследование Google о выборе просмотра для сравнительного обучения; обзор впечатляющих достижений Uber в области машинного обучения с открытым исходным кодом.

Грань № 28: отладка моделей машинного обучения; Исследования Uber в области архитектуры Manifold для отладки машинного обучения; Фреймворк TensorWatch от Microsoft.

Теперь давайте рассмотрим самые важные события в индустрии искусственного интеллекта на этой неделе.

🔎 Исследования машинного обучения

Обнаружение знаков при видеозвонках

Google Research опубликовал документ, в котором предлагается метод для модели обнаружения знаков в реальном времени, который можно применить к видеоконференцсвязи -› подробнее в блоге Google AI

Расизм и сексизм в языковых моделях, прошедших предварительное обучение

Институт ИИ Аллена (AI2) опубликовал документ и предоставил открытый исходный код новый набор данных, который показывает, как предварительно обученные языковые модели, такие как GPT-3 или BERT, побуждают создавать расистские, сексистские и другие токсичные тексты -› подробнее в блоге AI2

Набор инструментов противоборства

IBM опубликовала в блоге содержательную запись об уроках, извлеченных в прошлом году из набора инструментов для обеспечения устойчивости к состязаниям -› подробнее в блоге IBM Research

🤖 Крутые релизы AI Tech

Арчай

Microsoft Research с открытым исходным кодом Archai, новый фреймворк, который объединяет современные алгоритмы поиска нейронной архитектуры в общую базу кода -› подробнее в блоге Microsoft Research

ТРЯПКА

Facebook AI Research (FAIR) и стартап Hugging Face с открытым исходным кодом Retrieval Augmented Generation (RAG), метод обработки естественного языка, который интерпретирует контекстную информацию для целевой задачи -› подробнее в блоге FAIR

GDMix

LinkedIn Generalized Deep Mixed model (GDMix) с открытым исходным кодом, основа для обучения крупных моделей ранжирования, используемых в персонализированных системах рекомендаций -› прочтите этот блог инженерной группы LinkedIn

Решение проблемы "космического мусора"

IBM открыла исходный код двух новых проектов, Space Situal Awareness и Kubesat. Энтузиасты могут узнать больше о космических технологиях и помочь IBM улучшить связь между спутниками, а также спрогнозировать путь космического мусора -› подробнее в блоге IBM

💸 Деньги в AI

  • Подразделение Baidu, специализирующееся на голосовых помощниках и интеллектуальных устройствах, оценивается в 2,9 миллиарда долларов после недавнего нераскрытого раунда. Система разговорного искусственного интеллекта DuerOS компании встроена в интеллектуальные устройства Xiaodu (также компании Baidu). Этот голосовой помощник позволяет пользователям общаться с оборудованием, разговаривая с ним.
  • Биотехнологическая компания, занимающаяся разработкой лекарств с использованием искусственного интеллекта XtalPi, собрала 319 миллионов долларов в раунде C. Ее платформа, построенная на квантовой физике, искусственном интеллекте и высокопроизводительных алгоритмах облачных вычислений, помогает в отраслевых исследованиях. эффективность и улучшает разработку лекарств, делая точные прогнозы физико-химических и фармацевтических свойств малых молекул кандидатов для дизайна лекарств.
  • Стартап по автоматизации маркетинга SendinBlue привлек 160 миллионов долларов в рамках своего раунда финансирования. Конкурируя с Mailchimp, SendinBlue фокусируется на автоматизации. Используя искусственный интеллект и машинное обучение, его почтовый бот извлекает релевантный контент из писем, преквалифицирует их и обрабатывает определенные действия для оптимизации времени ответа.
  • Программное обеспечение для поддержки продаж Seismic привлекло 92 миллиона долларов в рамках раунда финансирования серии F. Его платформа использует искусственный интеллект для автоматизации частей цикла продаж и маркетинга и персонализации документов для торговых представителей. Он также рекомендует такие вещи, как самые популярные материалы, которые можно использовать в качестве воронки продаж.
  • Автоматизация складов и промышленные роботы обычно привлекают инвесторов. Робототехнический стартап Exotec привлек 90 миллионов долларов в рамках своего раунда финансирования. Он утверждает, что то, что делает их систему уникальной и гибкой, - это масштабируемость, позволяющая независимо выполнять требования к хранению и потоку данных, а также идти в ногу с ростом бизнеса.
  • Умная система видеодомофона ButterflyMX привлекла 35 миллионов долларов в рамках раунда роста собственного капитала. По сути, это позволяет людям открывать двери и управлять ими со своих смартфонов. Хотя такие системы очень полезны для арендаторов, они вызвали дискуссии о сборе и использовании данных, а также о других вопросах конфиденциальности, когда речь идет о распознавании лиц.
  • Аналитическая компания по разработке программного обеспечения Coralogix привлекла 25 миллионов долларов в рамках нового раунда финансирования. Команда создала механизм машинного обучения, который отслеживает журналы программного обеспечения в режиме реального времени, автоматически обнаруживает производственные проблемы, повышает стабильность системы и делает процесс обслуживания проще и дешевле.
  • Стартап по визуальной автоматизации задач Cogniac собрал 10 миллионов долларов. Потоки от камер машинного зрения, камер видеонаблюдения, дронов, смартфонов и других источников поступают на платформу искусственного интеллекта Cogniac. Используя глубокие сверточные нейронные сети, он определяет интересующие объекты и условия, такие как повреждение поверхности, обнаружение физических угроз в реальном времени, прогнозирование аварий и другие, а также может доставлять предупреждения и уведомления клиентам.
  • Стартап автономных грузовиков Einride собрал 10 миллионов долларов. Его система автономного электрического транспорта позволяет управлять как отдельными автономными модулями, так и их автопарком. Платформа грузовой мобильности с улучшенным ИИ позволяет грузоотправителям и водителям повысить эффективность маршрутизации при одновременном снижении энергопотребления.
  • Инструмент цифрового письма и редактирования Writer собрал 5 миллионов долларов. Конкурируя с Grammarly, он использует обработку естественного языка, чтобы помочь клиентам не только исправить грамматику, но и различать стили, создавая собственные правила бренда и руководства по стилю. В настоящее время он доступен только на английском языке, поскольку модель НЛП, которая построена глубоко для одного языка, не может быть обобщена на другой язык.