Объем последовательности: GPT-3 и большие языковые модели могут выйти из-под контроля

Еженедельный информационный бюллетень, в котором обсуждаются важные исследовательские работы по машинному обучению, интересные технические выпуски, деньги, полученные от ИИ, и реальные реализации.

Sequence Scope - это сводка наиболее важных опубликованных исследовательских работ, опубликованных новостей о технологиях и стартапах в экосистеме ИИ за последнюю неделю. Этот сборник является частью информационного бюллетеня TheSequence. Специалисты по обработке данных, ученые и разработчики из Microsoft Research, Intel Corporation, Linux Foundation AI, Google, Lockheed Martin, Кардиффского университета, Колледжа наук Меллона, Варшавского технологического университета, Политехнического университета Валенсии и других компаний. и университеты уже подписаны на TheSequence.

TheSequence
TheSequence объясняет основные концепции машинного обучения и держит вас в курсе самых актуальных проектов и… thesequence.substack.com

📝 От редакции: GPT-3 и большие языковые модели могут выйти из-под контроля

Арнольд Шварценеггер действительно испортил для нас ИИ. Когда люди думают об опасном использовании ИИ, им в голову приходят образы роботов-убийц в духе Терминатора. Хотя версия ИИ «Терминатор» отлично подходит для заголовков новостей, она полностью выходит за рамки возможностей современных технологий ИИ. Вместо того, чтобы фантазировать о роботах-убийцах, мы должны обратить внимание на другие области ИИ, которые при ненадлежащем использовании могут стать чрезвычайно токсичными и опасными. Из этих областей наиболее ярким примером могут быть модели с предварительно обученным языком, такие как OpenAI GPT-3 или Google Switch Transformer.

Чтобы уточнить, я оптимист по натуре и считаю, что предварительно обученные языковые модели и архитектуры преобразователей являются крупнейшей вехой за последние пять лет ИИ.

Однако нельзя отрицать, что возможности предварительно обученных языковых моделей могут очень быстро выйти из-под контроля. Применение этих моделей к вредоносным сценариям, таким как генерация глубоких фейков, дезинформация или предвзятость, не требует значительных технических усилий. Хотя сегодня большие языковые модели с предварительной подготовкой находятся под контролем некоторых уважаемых компаний, таких как OpenAI, Microsoft и Google, это всего лишь вопрос месяцев, прежде чем эти возможности будут воссозданы другими организациями. Широкое распространение предварительно обученных моделей большого языка может привести к хаосу. Буквально на этой неделе исследователи из OpenAI и Стэнфордского университета опубликовали очень содержательный документ, повышающий осведомленность об этих рисках.

Предварительно обученные языковые модели потрясающие, но они также расширят этические границы нынешнего поколения компаний, занимающихся ИИ.

🔎 Исследования машинного обучения

Возможности и ограничения моделей типа GPT-3

Исследователи из OpenAI и Стэнфордского университета опубликовали сводку дискуссий, посвященных изучению возможностей и ощутимых ограничений больших языковых моделей, таких как GPT-3 или Switch Transformer от Google -› подробнее в исходной исследовательской статье

Многоязычные модели, основанные на одном языке

IBM Research опубликовала документ, в котором предлагается методика, позволяющая моделям машинного обучения справляться с задачами на нескольких языках, даже если они были обучены только одному языку -› подробнее в блоге IBM Research

Защита классификаторов от состязательных атак

Microsoft Research опубликовала документ, в котором описывается метод, называемый шумоподавляющим сглаживанием, который может повысить надежность классификаторов без необходимости повторного обучения -› подробнее в блоге Microsoft Research

🤖 Крутые релизы AI Tech

TensorFlow 3D

TensorFlow 3D с открытым кодом от Google Research, библиотека для моделей машинного обучения в 3D-средах -› подробнее в блоге Google Research

Apache Superset

Airbnb опубликовал содержательную запись в блоге, в которой подробно описал свои методы масштабирования платформы самообслуживания бизнес-аналитики Apache Superset -› подробнее в блоге разработчиков Airbnb

Индикаторы честности LinkedIn

Команда инженеров LinkedIn опубликовала подробное сообщение в блоге, в котором объясняется использование набора индикаторов справедливости в крупномасштабных моделях машинного обучения -› подробнее в этом сообщении в блоге от группы инженеров LinkedIn

💸 Деньги в AI

Для машинного обучения и искусственного интеллекта

Платформа аннотации и маркировки данных Labelbox собрала 40 миллионов долларов (слава команде! 👏). Labelbox - это ведущая платформа обучающих данных для корпоративных приложений машинного обучения. Они создали полный рабочий процесс для более эффективной организации и управления данными, людьми и процессами.
Стартап по обеспечению надежности данных Монте-Карло привлек 25 миллионов долларов. Монте-Карло использует машинное обучение, чтобы делать выводы и изучать, как выглядят данные клиента, заранее выявлять время простоя данных, оценивать его влияние и уведомлять тех, кому это необходимо.
Полупроводниковый стартап NeuReality собрал 8 миллионов долларов в посевном раунде, выйдя из скрытого режима. Специально созданная архитектура системы искусственного интеллекта NeuReality разработана специально для возрастающей сложности и масштабирования приложений логического вывода ИИ, обеспечивая масштабирование реальных приложений ИИ.

Реализация ИИ

Решения по оптимизации кибербезопасности CYE привлекли более $ 100 млн в рамках раунда финансирования. Hyver, флагманский продукт CYE, использует передовые алгоритмы и графическое моделирование для проведения комплексной оценки кибербезопасности, охватывающей всю организацию, а также сторонних поставщиков.
Биотехнологическая компания Иммунай привлекла 60 миллионов долларов в раунде серии А. Этот стартап сочетает одноклеточную геномику с алгоритмами машинного обучения, чтобы обеспечить профилирование иммунной системы с высоким разрешением. ИИ сопоставляет данные с сотнями типов и состояний клеток, извлекая информацию, которая ведет к открытию и разработке более эффективных и целенаправленных иммунотерапевтических методов.
Платформа для создания антител под управлением искусственного интеллекта BigHat Biosciences собрала 19 миллионов долларов в раунде серии А. Лаборатория влажной среды BigHat активно производит и анализирует антитела в большом количестве. Облачная платформа AI / ML совершенствует конструкции каждый раунд, сочетая активное обучение с аналитическим моделированием критических биофизических свойств, что приводит к последовательностям высочайшего качества.
Разработчик хирургической платформы Театор собрал $ 15,5 млн в раунде серии А. Они делают довольно крутые вещи: используя искусственный интеллект и компьютерное зрение, платформа извлекает и аннотирует каждый ключевой момент из реальных процедур, давая хирургам возможность получить глубокое научное представление о своих действиях и действиях хирургов во всем мире.
Стартап Intenseye по обеспечению безопасности рабочего места на базе искусственного интеллекта собрал посевной раунд на сумму 4 миллиона долларов. Используя компьютерное зрение и подключенные камеры, Intenseye дает возможность командам EHS применять передовые методы охраны труда и техники безопасности на своих предприятиях.
Понимание языков, платформа без кода Lang.ai привлекла начальный раунд финансирования на сумму 2 миллиона долларов. Платформа позволяет следующему поколению продуктов и приложений НЛП масштабировать процессы, имеющие дело с текстом, от опросов до центров обработки вызовов и создания чат-ботов.

Объем последовательности: GPT-3 и большие языковые модели могут выйти из-под контроля

📝 От редакции: GPT-3 и большие языковые модели могут выйти из-под контроля

🔎 Исследования машинного обучения

🤖 Крутые релизы AI Tech

💸 Деньги в AI

Вопросы по теме