Всем привет, добро пожаловать в Dynamicly Typed #58! В сегодняшнем выпуске я написал о Базе данных инцидентов ИИ, новом проекте Партнерства по ИИ, который призван помочь будущим исследователям и разработчикам машинного обучения избежать повторения плохих результатов, которые исторически вызывали системы на основе ИИ.

Кроме того, сегодня у меня есть довольно много ссылок на продукты ИИ: Facebook запустил большое обновление своей функции, которая помогает слепым и слабовидящим людям понимать изображения в их новостной ленте; инженер Dropbox объяснил, как приоритезация машинного обучения может помочь снизить затраты на вычисления; и проблема с функцией перевода живой речи Google Translate оказалась интересным примером нефункциональных требований к продуктам на базе ИИ. А для исследования машинного обучения я рассмотрел новую запись в ветке Distill Circuits о детекторах высоких и низких частот. (За последние недели в области климатического ИИ и ИИ-искусства произошло не так много событий, поэтому сегодня у меня нет ссылок на эти разделы.)

Произведенный искусственный интеллект 🔌

Партнерство в области искусственного интеллекта на благо людей и общества (PAI) — это международная коалиция организаций, миссией которой является формирование передового опыта, исследований и общественного диалога о преимуществах искусственного интеллекта для людей и общества. Его более 100 членских организаций охватывают широкий спектр интересов и включают ведущие исследовательские лаборатории ИИ (DeepMind, OpenAI); несколько университетов (MIT, Cornell); большинство крупных технологических компаний (Google, Apple, Facebook, Amazon, Microsoft); средства массовой информации (NYT, BBC); и гуманитарные организации (ЮНИСЕФ, ACLU).

PAI недавно запустила новый проект: База данных инцидентов ИИ. AIID имитирует базу данных авиационных происшествий FAA и аналогичным образом призван помочь будущим исследователям и разработчикам избежать повторения плохих результатов. Он запускается с набором 93 происшествий, включая беспилотный автомобиль, убивший пешехода, торговый алгоритм, вызвавший внезапную аварию, и систему распознавания лиц, вызвавшую арест невиновного человека (см. ДТ №43). Для каждого инцидента база данных включает набор новостных статей, в которых о нем сообщалось: на данный момент в AIID имеется более 1000 отчетов. Это также с открытым исходным кодом на GitHub, в PartnershipOnAI/aiid.

Подобные системы (и, например, Амстердамский реестр ИИ) являются явным признаком того, что продуктизированный ИИ быстро начинает развиваться как область, и что делается много хорошей работы, чтобы управлять его влиянием. Самое главное, я надеюсь, что эти проекты помогут нам вести более разумные дискуссии о регулировании ИИ. Эссе Бенедикта Эванса Заметки о предвзятости ИИ и Распознавание лиц и этика ИИ отлично читаются на эту тему; он сравнивает призывы регулировать ИИ с желанием регулировать базы данных — это неправильный уровень абстракции, и вместо этого мы должны думать о конкретных политиках для решения конкретных проблем. Набор данных о категоризированных инцидентах с ИИ, управляемых широкой коалицией организаций, звучит как большой шаг в этом направлении.

Быстрые ссылки на искусственный интеллект 🔌

  • 👓 Facebook запустил значительно улучшенную версию своей функции автоматического альтернативного текста (AAT), которая помогает слепым или слабовидящим людям понимать содержание изображений в своей ленте Facebook. Как объясняется в сообщении в техническом блоге Facebook, эта новая версия AAT может распознавать более 1200 различных концепций. Интересно, что модель обучалась на слабо контролируемых данных, используя хэштеги на миллиардах общедоступных изображений в Instagram в качестве меток. Поэтому, если вы когда-либо публиковали фотографию своего латте и отмечали ее тегом #latte в Instagram, возможно, вы оказали незначительное влияние на эту функцию. В сообщении в блоге также подробно описывается исследование пользователей, направленное на улучшение AAT — то, о чем, я думаю, мы обычно не слышим достаточно (или недостаточно делаем!) в отношении искусственного интеллекта, поэтому обязательно прочитайте. (Хотел бы я упомянуть человека, написавшего этот пост, но, к сожалению, Facebook сохраняет анонимность этих постов, что кажется немного нехарактерным для компании.)
  • 📑 Вин Суен написала о системе машинного обучения, работающей в Dropbox, которая решает, для каких файлов следует отображать предварительный просмотр: Канны: как машинное обучение экономит нам 1,7 миллиона долларов в год на предварительном просмотре документов. Она рассматривает два аспекта проектирования для создания высокопроизводительной системы искусственного интеллекта: компромисс между затратами и выгодами за счет экономии инфраструктуры за счет машинного обучения (отображение меньшего количества предварительных просмотров для экономии вычислительных ресурсов по сравнению с ухудшением пользовательского опыта из-за отсутствия предварительных просмотров) и компромисс между сложностью модели (точность прогнозирования). по сравнению с интерпретируемостью и стоимостью развертывания). Окончательная модель представляет собой классификатор с градиентным усилением, который может предсказывать предварительный просмотр до 60 дней после предварительного прогрева с точностью > 70%.
  • 💱 Навин Ариважаган и Колин Черри написали пост для блога Google AI о том, как они решили проблему с функцией перевода живой речи в Google Translate: переводы часто обновлялись по мере того, как становилось доступно больше расшифрованного текста, что отвлекало пользователей. . Это крутой взгляд на все, кроме точности модели и скорости, которые важны для создания успешного продукта на основе ИИ, и на то, как инженеры думают о превращении этих нефункциональных требований в измеримые показатели производительности, для которых они могут оптимизировать.

Исследования в области машинного обучения 🎛

  • 🦚 Людвиг Шуберт, Челси Восс и Крис Ола опубликовали новую запись в теме Distill Circuits, в которой моделируют соединения в обученных сверточных нейронных сетях как логические схемы, чтобы понять, как они работают; Я рассказал, что делает это исследование таким интересным, в апреле прошлого года в статье Distill: Early Vision in CNN. Используя визуализацию признаков, примеры наборов данных и синтетические кривые настройки, эта новая статья подробно описывает относительно неинтуитивный класс нейронов: Детекторы высокой-низкой частоты, которые активируются, когда сталкиваются с направленными переходами от низкой к высокой пространственной частоте. ” В одном очень крутом разделе статьи авторы объединяют кластеры высокочастотных и низкочастотных компонентов схемы в два общих ВЧ- и НЧ-фактора и показывают, что они играют одинаковые роли в реализации ВЧ-НЧ. детекторы, как и их отдельные компоненты. Как всегда, статья отлично читается на выходных.

Я также собрал все более 75 исследовательских инструментов машинного обучения, которые ранее были представлены в Dynamically Typed на странице понятий для быстрого ознакомления. ⚡️

Спасибо за прочтение! Если вам понравился этот выпуск журнала Dynamically Typed, рассмотрите вариант подписки, чтобы получать новые выпуски прямо на ваш почтовый ящик каждое второе воскресенье.

Первоначально опубликовано 31 января 2020 г. на странице https://dynamicallytyped.com.