Эволюция Машинного Интеллекта (или Искусственного интеллекта, ИИ) — одна из основных тенденций, формирующих будущее человечества. Это критически важная часть решения проблемы старения населения, стагнации производительности и снижения эффективности производства энергии. Это также будет иметь решающее значение для нашей экспансии за пределы Земли. Это может оказаться самой важной технологией, которую мы когда-либо разрабатывали, и она обещает замечательные достижения, но также и серьезную опасность для человечества.

Ниже представлена ​​наша схема того, как думать об ИИ. Что это. Каково текущее состояние и как оно может развиваться в будущем.

Что такое ИИ

Термин ИИ существует уже некоторое время и представляет собой зонтик, который включает в себя многие области информатики, преследующие цель позволить машинам выполнять задачи, обычно связанные с разумными существами. Однако определение настолько широкое, что мы не находим его практичным для использования. Вместо этого мы рассматриваем возможности машины как спектр — переходя от простых, узких и прямолинейных задач к более сложным и нечетким.

Чем дальше мы продвигаемся по этому спектру, тем больше ресурсов требуется машине (вычислительная мощность, хранилище, пропускная способность) и тем более сложным должно быть аппаратное и программное обеспечение.

Аппаратное обеспечение является движущей силой достижений. Например, концепция искусственной нейронной сети (ИНС) существует по крайней мере с 1960-х годов, однако внедрению этой технологии препятствует недостаточная вычислительная мощность.
Благодаря достижениям в производстве полупроводников более было построено сложное оборудование и разработано новое программное обеспечение для использования доступной мощности.

Первое программное обеспечение было написано на простых императивных языках, таких как ассемблер (а до этого — на перфокартах), потому что это был единственный тип инструкций, которые аппаратное обеспечение могло обрабатывать. Затем появились процедурные языки, такие как C, надстройка над ассемблером, значительно упрощающая создание программ. Следующим огромным шагом вперед стало объектно-ориентированное программирование (ООП), метод, который требовал гораздо более мощного оборудования, а также более сложного программного обеспечения (среды выполнения) для запуска новых программ. На данный момент мы находимся в золотом веке искусственных нейронных сетей (ИНС). Каждый шаг выше позволял машинам решать все более сложные задачи.

Но есть постепенный переход от ООП и его предшественников к ИНС. В первом случае вы «кодируете» системные действия, точно описывая, что система должна делать. Вывод также будет точным, а его качество будет определяться написанным вами кодом и не изменится, пока вы не измените код.

Однако ANN — это пустой сосуд. При настройке он ничего не может сделать. Вы обучаете его выполнять желаемое действие, предоставляя ему входные данные и давая обратную связь — насколько хорош его результат (например, вы «показываете» ему разные изображения и просите идентифицировать в них объекты или предоставляете часть предложения и попросите оценить, каким будет следующее слово в нем). Результат меняется по мере того, как система стремится получить более благоприятную обратную связь. Этот подход называется машинным обучением — способность учиться без явного программирования.

Преимущество подхода в том, что вам не нужно выяснять точный алгоритм того, как конкретное действие должно выполняться системой. Система должна разобраться сама на основе полученной обратной связи.

При таком подходе есть несколько компромиссов:

  • Вывод системы машинного обучения всегда неточен, всегда приблизителен — нет смысла использовать его для расчета налогов.
  • Вывод всегда вероятностный — система распознавания изображений ML скажет вам, что на этом изображении есть 96% кошек, но никогда не 100%.
  • При представлении входных данных, сильно отличающихся от обучающего набора, система может давать совершенно бессмысленные результаты.
  • Чувствительность к обучающим данным. Текущие методы машинного обучения требуют очень больших объемов высококачественных данных для их обучения и будут плохо работать в противном случае. Если в обучающих данных есть погрешности, эти погрешности будут унаследованы системой.
  • Внутренняя работа системы непрозрачна. Поскольку мы не программировали систему явно, а вместо этого дали ей учиться, мы не знаем, как именно она выполняет задачу, и (при сложных реализациях) не можем объяснить, почему она допустила ту или иную ошибку.

Имеет смысл думать о современных системах машинного обучения на основе ИНС (они называются системами глубокого обучения или системами глубокого обучения) как о действиях, подобных человеческой интуиции. Наша интуиция также неточна, вероятностна, может ошибаться, если используется за пределами нашей области опыта, и мы не можем точно объяснить, как она работает.

Эти недостатки являются ценой способности системы ГО выполнять действия, которые слишком сложны, чтобы их можно было жестко запрограммировать, в том числе такие, в которых люди-эксперты даже не знают правильного алгоритма (например, не существует известного алгоритма для надежного различения изображения объекта). собака с картинки кота).

Действия, которые мы автоматизируем с помощью системы DL, должны иметь некоторую устойчивость к неточностям/ошибкам, но оказывается, что большинство сложных действий в реальном мире допускают такие ошибки. В производстве системы DL дополняются либо человеком в процессе работы, либо традиционным программным обеспечением, отфильтровывающим критические ошибки.

Ниже приводится сводка подходов:

Чтобы узнать больше об исследовании возможностей системы, взгляните на эту заметку об улучшении результатов системы ДО, включив в инструкции текст Давайте подумаем шаг за шагом, или эту на заметке системы генерации изображений. тайный язык.

Обратите внимание, что на практике большинство реализаций систем ИИ включают несколько различных типов ИНС, а также соответствующие традиционные программные модули, чтобы компенсировать недостатки ГО.

Говоря о приложениях ИИ ниже, мы имеем в виду комбинированные системы.

Приложения ИИ

Внедрение ИИ началось с задач с более узким охватом и более высокой устойчивостью к ошибкам, таких как рекомендации (показ виджетов «люди также покупают» или выбор следующего поста в ленте социальной сети), диктовка, оптическое распознавание символов и базовое распознавание изображений. Хотя раньше такие задачи выполнялись жестко закодированными алгоритмами, подход ГО продемонстрировал гораздо лучшие результаты.

Принятие в настоящее время расширяется по следующим трем направлениям.

Расширение существующих возможностей программного обеспечения во всех областях.

Как и в приведенных выше примерах, методы глубокого обучения дополняют жестко закодированные алгоритмы в каждой отрасли, от здравоохранения до военных, улучшают анализ данных, моделирование, преобразование данных и многое другое. Каждая машина будет оснащена чипами следующего поколения и прошивкой, поддерживающей DL.

Увеличение числа работников умственного труда/совместного творчества.

Первые результаты показывают, что методы глубокого обучения можно использовать для совместного творчества, когда люди направляют машину для создания черновиков и редактирования выходных данных. Есть ранние примеры совместного написания, совместного кодирования, совместного сочинения, совместного проектирования, совместной науки и так далее.

Увеличение физического труда.

Физический мир — сложная среда. В то время как более узкие задачи, такие как удержание автомобиля в полосе, выбор товара из коробки, шлифовка поверхности и т. п. решаются с помощью одноцелевых роботов, менее Методов искусственного интеллекта будет достаточно для решения задач автономных транспортных средств на общественных улицах и более универсальных роботов (см. раздел Области исследований ниже).

При этом даже решение части перечисленных выше задач окажет значительное влияние на экономику. Установка промышленных роботов уже создает эквивалент дополнительных 1,3 миллиона рабочих мест ежегодно, и это число выросло в 3 раза за последние десять лет [1]. В то время как большинство установленных сегодня роботов являются традиционными, проникновение ИИ растет, особенно в сегменте роботов для совместной работы. В сфере услуг внедрение роботов только начинается, что связано с выполнением заказов, уборкой, питанием и безопасностью.

На следующем рисунке перечислены некоторые варианты использования ИИ в зависимости от их зрелости. Все они еще находятся на стадии становления, так как отрасль относительно молода, но некоторые из них еще впереди.

Размер рынка

Основываясь на наших оценках, мы считаем, что общий мировой рынок систем искусственного интеллекта составляет порядка 10 трлн долларов с разбивкой на четыре области ниже:

  • Расширение текущих возможностей: ~$1 трлн.
  • Физический труд: ~ 5 трлн долларов (наземный транспорт ~ 1 трлн долларов, физический труд в горнодобывающей промышленности, строительстве, производстве, оптовой и розничной торговле, транспортировке и складировании ~ 4 трлн долларов).
  • Работники умственного труда: ~$4 трлн.
  • Инфраструктура ИИ: оборудование, инструменты и услуги для создания/запуска систем ИИ (~ 1 трлн долларов).

В зависимости от того, насколько мощной окажется технология, мы можем увидеть рынок в несколько триллионов долларов в течение следующего десятилетия.

Стек системы ИИ

Ниже приведены основные компоненты стека.

  • Талант. Инженеры и исследователи. Но также и хедхантеры, аутсорсинговые магазины, биржи фриланса и другие сервисы, которые помогают связать этих экспертов с работой.
  • Оборудование. TPU, GPU и CPU в настоящее время являются основными источниками вычислительной мощности для ANN, в то время как новые технологии, такие как нейроморфные чипы, разрабатываются. Первоначально аппаратное обеспечение настраивалось и настраивалось собственными силами, однако в настоящее время разработчики все чаще используют ресурсы, доступные в общедоступном облаке.
  • Архитектуры. Поскольку ИНС не программируются, а обучаются выполнять определенные действия, задача инженера состоит в том, чтобы придумать наиболее эффективную архитектуру различных типов ИНС (например, СНС, преобразователей) и традиционного программного обеспечения на основе поставленной задачи. Стандартные блоки и эталонные архитектуры разрабатываются сообществом разработчиков открытого исходного кода, академическими кругами и предприятиями под руководством крупных технологических компаний (Google, Meta, Microsoft, Amazon, Open AI и других).
  • Данные. Можно собирать и маркировать самостоятельно и/или приобретать у третьих лиц. Данные также могут быть созданы искусственно, чтобы охватить случаи, которые недостаточно хорошо представлены в существующих наборах данных. Несмотря на то, что существуют наборы данных с открытым исходным кодом, доступность данных стала одним из самых важных узких мест для исследователей с открытым исходным кодом / академических исследователей (другое — доступ к мощному оборудованию).
  • Инструменты и услуги. Программное обеспечение, которое помогает создавать и управлять приложениями искусственного интеллекта или роботизированными системами в производстве. Инструменты для управления данными, развертывания, мониторинга, аналитики и т. д. Также в эту категорию мы включаем службы, которые собирают или маркируют данные для клиентов.
  • Модель как услуга (MaaS). В то время как некоторые разработчики приложений будут проектировать и обучать системы DL с нуля, многие будут использовать MaaS, где предварительно обученная ИНС (модель) доступна и готова к использованию с ограниченной тонкой настройкой. Облачные модели выполняют всю тяжелую работу по обработке, в то время как приложение собирает данные, координирует модели и представляет результат в форме (или наборе действий), необходимой клиенту. Это особенно актуально, когда модель очень большая (например, GPT-3 или PaLM) и развертывать ее отдельно для каждого приложения/клиента нецелесообразно. Использование MaaS также значительно сокращает время выхода на рынок. Самые передовые системы используют несколько предложений MaaS от разных поставщиков для достижения наилучших результатов.
  • Приложение. Выполняет желаемые действия и обеспечивает ценность для конечного пользователя. Реализуется как приложение (облачное, десктопное, мобильное, VR/AR и т. д.), аппаратная прошивка/программное обеспечение или робот.
  • Воплощение. Сенсоры, манипуляторы, локомоция и т. д. для систем, взаимодействующих с физическим миром (электромобили, дроны, роботы).
  • Интеграция. Реализация приложения в среде заказчика, интеграция с другими системами, в том числе с другими приложениями. Точная настройка предварительно обученных ИНС и MaaS с использованием данных, специфичных для клиента (например, настройка службы перевода на общий язык в соответствии с терминологией, специфичной для клиента), постоянная работа с данными клиента и мониторинг системы ИИ, чтобы убедиться, что она работает в соответствии с планом.

Известные проблемы систем искусственного интеллекта и области исследований

В то время как современные системы искусственного интеллекта демонстрируют довольно впечатляющие результаты в задачах, начиная от распознавания изображений и заканчивая игрой в го и даже объяснением шуток, это все еще первые дни, и есть множество областей для улучшения, включая способности лучше обобщать, учиться из меньшего количества выборок, обработки нескольких типов данных и энергоэффективности. Многие из них взаимосвязаны и, вероятно, потребуют инноваций на уровнях системной архитектуры, масштаба и аппаратной архитектуры для достижения прорывов.

Тенденции

Мы ожидаем, что эти многолетние тенденции будут определять эволюцию систем ИИ.

  • Модели большего размера и более мощное оборудование позволяют системам ИИ выполнять более сложные действия.
  • Новые архитектуры, обеспечивающие лучшее обобщение и рассуждения.
  • Мультимодальность — способность обрабатывать и связывать информацию из нескольких модальностей, таких как текст, аудио, визуальные эффекты и т. д. Такие модели, как Dall-E, Imagen и NUWA, являются шагами в этом направлении.
  • Внедрение ИИ во все современное программное обеспечение, уже используемое бизнесом и потребителями (как в качестве базового движка, так и в качестве интерфейса, позволяющего управлять программным обеспечением с помощью языка, жестов и т. д.)
  • Возникновение ИИ, служащего связующим звеном между различными системами (следующий уровень РПА).
  • Внедрение ИИ в каждое устройство с чипом.
  • Совершенство DataOps/MLOps, позволяющее масштабировать приложения ИИ на предприятии.
  • Взрыв приложений, созданных на основе MaaS, где разработчики получают выгоду от постоянных улучшений MaaS и используют нескольких поставщиков для достижения оптимальных результатов.
  • Переход от модульной к сквозной архитектуре.
  • Расширение ИИ в реальном времени.
  • Сотворчество в копирайтинге, анимации, музыке, компьютерных играх и других творческих задачах.
  • Снижение стоимости промышленных и сервисных роботов, включая модели «роботы как услуга» и «оплата по мере использования», а также рост предложения недорогих роботов.
  • Растет плотность роботов в промышленности (текущий средний показатель по миру — 126 роботов на 10 000 сотрудников, в то время как в Южной Корее — 932). Постепенное проникновение услуг.
  • Распределение поставщиков аппаратного обеспечения (чипы), MaaS и граничного автономного программного обеспечения (питание дронов и роботов) по степенному закону. Горстка компаний будет контролировать большую часть рынка.
  • Глобальный прогресс в области ИИ во главе с США и Китаем. Ученые Академии наук Китая, университетов Пекина и Цинхуа уже сейчас конкурируют со старейшими и лучшими университетами мира: Оксфордом, Кембриджем, Гарвардом, Стэнфордом. В целом, CCP считает ИИ критически важной областью для глобального лидерства Китая. Китай также является крупнейшим местом назначения промышленных роботов (48% мировых установок в 2020 году).

Чтобы углубиться, вот хороший обзор эволюции ИИ Натана Бенаиха и Яна Хогарта.

[1] Один промышленный робот эквивалентен примерно 3,3 рабочим, и ежегодно устанавливается около 400 000 роботов.