Лучшее из искусственного интеллекта: новые статьи, опубликованные в этом месяце (ноябрь 2019 г.)

10 статей с данными, подобранных командой Sicara специально для вас

Добро пожаловать в ноябрьский выпуск наших лучших и любимых статей по ИИ, опубликованных в этом месяце. Мы - парижская компания, занимающаяся Agile-разработкой данных.

В этом месяце мы заметили статьи об искусственном интеллекте, которые могут определить, кто написал каждую сцену в шекспировском «Генрихе VIII», и научить людей, не являющихся носителями языка, произносить английские слова! Начнем, как обычно, с комикса месяца:

1 - Прогнозируйте влияние песни на наши эмоции

Машинное обучение, музыка и эмоции

В недавней статье исследователи описывают, как они обучали алгоритмы машинного обучения предсказывать, какие элементы в песне повлияют на эмоциональные реакции людей.

Они предсказывали деятельность мозга и сердца, а также физиологические реакции, используя функции, основанные на динамике музыки, такие как тембр, гармония и т. Д.

Эта работа помогает понять, как музыка влияет на человеческий опыт, и находит применение в распознавании музыкальных эмоций и нейробиологии.

2 - Мобильное приложение для улучшения английского произношения людей, не являющихся носителями языка

Как улучшить свое английское произношение, если, как и я, вы не всегда понимаете, почему ваше предложение произносится неправильно? Стартап использовал машинное обучение для решения этой задачи! Blue Canoe создала мобильное приложение, предлагающее пользователям повторять подсказки предложений. Затем технология распознавания речи анализирует записи и использует модели машинного обучения, чтобы указать на различия. Когда пользователи проводят в приложении 10 минут в день, персонализированная обратная связь сообщает учащимся, как именно они произносят слова. Стартап начался с оцифровки 20-летней методологии под названием Система цветных гласных. Затем они наняли лингвистов, чтобы они прослушали записи пользователей и отметили проблемы. Затем записи используются для улучшения моделей машинного обучения.

3 - Дроны для обнаружения пропавших без вести

В то время как Калифорния была в прошлом месяце третьим штатом, подставившим полицией программы для распознавания лиц, полиция Шотландии в этом месяце представила новый беспилотник, использующий компьютерное зрение для поиска пропавших без вести и уязвимых людей, сообщает BBC. Его программное обеспечение для распознавания достаточно легкое, чтобы его можно было использовать на смартфоне, и использует оптическую камеру и датчик, определяющий тепло. Подразделение воздушной поддержки полиции Шотландии подробно описало аспекты своего беспилотника, чтобы утверждать, что он не будет использоваться для шпионажа за гражданами: Мы полностью соблюдаем все законы в области прав человека - на самом деле, была проведена оценка воздействия на защиту данных, и мы пересматриваем ее ежегодно. . Кроме того, перед развертыванием мы будем использовать социальные сети, чтобы рассказать общественности, что мы делаем. Кроме того, его синий свет и звук ротора должны предупреждать людей о его присутствии, считает «BBC.

4 - Распознавание видео через Facebook

PySlowFast - система распознавания видео Facebook - теперь доступна на GitHub, а ее механизмы описаны в препринте. Основная интуиция этой системы заключается в воспроизведении клеток глаза приматов. Эти клетки либо функционируют с низкой частотой и сосредотачиваются на мелких деталях, либо реагируют на быстрые изменения. Переносится в систему распознавания этого видео: видео обрабатывается с низкой и более высокой временной скоростью. Чем ниже для распознавания статических областей, тем выше для распознавания динамических областей. Эта модель была сопоставлена с двумя популярными наборами данных: DeepMind Kinetics-400 и Google AVA и достигла самых современных результатов по обоим.

5 - Полный выпуск противоречивого ИИ, генерирующего текст GPT-2

5 ноября прошлого года OpenAi, наконец, выпустила самую крупную версию своей спорной модели GPT-2, заявив, что до сих пор не нашла убедительных доказательств злоупотребления. GPT-2 - это модель глубокого обучения, способная выводить достоверный текст из минимального приглашения (демонстрация здесь). Эта полная версия изначально не была выпущена в феврале прошлого года, поскольку OpenAi опасалась, что ее можно будет использовать для автоматического создания фейковых новостей (краткое изложение дискуссии здесь). Они мотивировали этот поздний выпуск следующими аргументами:

эта версия модели имеет лишь незначительно больший «показатель достоверности» по сравнению с уже выпущенной версией (согласно опросу Корнельского университета).
они признают, что «GPT-2 можно настроить для неправильного использования», но утверждают, что «несмотря на низкую точность обнаружения на синтетических выходных данных, методы обнаружения на основе машинного обучения могут вызвать у экспертов разумное подозрение, что субъект генерирует синтетический текст»
они провели собственное исследование по обнаружению и разработали программу с коэффициентом обнаружения около 95% для обнаружения 1.5B текста, созданного GPT-2. Выпуская эту версию, они стремятся «помочь в изучении исследований по обнаружению синтетического текста, хотя это позволяет злоумышленникам с доступом лучше уклоняться от обнаружения».

6 - Доступен французский BERT (CamemBERT)!

Французская версия BERT вышла на репо huggingface / transformers! BERT или двунаправленные представления кодировщика от Transformers - это метод, основанный на предварительных языковых представлениях, которые позволили получить самые современные результаты по широкому спектру задач обработки естественного языка (пояснения Google здесь). Эта французская версия была обучена на 138 ГБ французского текста и доступна как в Pytorch, так и в Tensorflow 2. Этот выпуск является результатом сотрудничества между Facebook AI, INRIA и Sorbonne Université.

7 - Рекомендации приложений в магазине Google Play

В интересном сообщении в блоге Deepmind объяснил свои подходы к реализации алгоритмов рекомендаций для Google Play Store, чтобы помочь пользователям находить персонализированные приложения. Первый подход с использованием LSTM (нейронная сеть, используемая для обработки последовательностей) был заменен на преобразователи, которые улучшили производительность модели, но также увеличили стоимость обучения. Третье и последнее решение заключалось в том, чтобы реализовать эффективную модель аддитивного внимания, которая работает для любой комбинации функций последовательности, но при этом требует низких вычислительных затрат. Кроме того, сообщение в блоге представило проблему смещения рекомендаций и то, как они с ней справляются: Например, если приложение A отображается в Play Store в 10 раз чаще, чем приложение B, оно с большей вероятностью будет установлено пользователем, и, следовательно, больше вероятно, будет рекомендована нашей моделью . Они подробно рассказали об уточнениях, которые они внесли в рекомендации по повторному ранжированию и оптимизации для нескольких целей, таких как релевантность, популярность или личные предпочтения.

8 - Определите, кто написал каждый шекспировский Генрих VIII. Сцены

Новый подход к продолжающимся столетие дебатам!

Некоторые литературные аналитики считают, что Шекспир не писал свою пьесу Генрих VIII в одиночку, но ему помог Джон Флетчер, писатель, который заменил его в качестве драматурга Людей короля после его смерти. В середине девятнадцатого века литературный аналитик Джеймс Спеддинг уже предложил разделение, основанное на использовании одиннадцатисложных строк. В 1962 году влиятельный аналитик разделил пьесу между Шекспиром и Флетчером, основываясь на их отличительном выборе слов, например, как Флетчер использует слова вы для вас и em для них. А в прошлом месяце Петр Плехач из Чешской академии наук в Праге заявил, что он изучил проблему с помощью машинного обучения, чтобы определить авторство на более точном уровне (не только приписывая сцены): Наши результаты полностью подтверждают каноническое разделение пьесы. между Уильямом Шекспиром и Джоном Флетчером по предложению Джеймса Спеддинга .

9 - Увеличение производства энергии солнечными панелями

Стартап под названием Heliogen стремится увеличить производство энергии солнечных панелей с помощью передового программного обеспечения компьютерного зрения. Воздействие такой технологии не должно ограничиваться увеличением производства энергии. Ожидается, что благодаря точной настройке зеркал Heliogen сможет достичь температуры более 1000 градусов по Цельсию. Такие высокие температуры могут быть использованы для промышленных применений, на которые в настоящее время приходится примерно 75 процентов потребности в энергии за счет производства ископаемого топлива. Кроме того, эта технология в конечном итоге может стать альтернативой бензину для двигателей автомобилей за счет расщепления молекул углекислого газа и воды для получения экологически чистого топлива, такого как водород, - поясняется в статье. Таким образом, эта технология на основе искусственного интеллекта может стать шагом к успешному использованию солнечной энергии в областях, где все еще зависит от ископаемого топлива.

10. Самообучение с помощью Noisy Student улучшает классификацию ImageNet

В статье, представленной 11 ноября прошлого года, трое исследователей объяснили, как они достигли точности 87,4% в топ-1 ImageNet, что на 1,0% лучше, чем у современной модели, требующей 3,5 млрд слабо маркированных изображений Instagram. ImageNet - известная база данных изображений, часто используемая для измерения производительности нейронных сетей классификации изображений. Чтобы достичь этого результата, они сначала обучили EfficientNet на помеченных изображениях ImageNet и использовали его для маркировки 300 миллионов немаркированных изображений (он создает псевдо-метки, поскольку эти метки не являются истиной, а являются предсказанием). Эта первая сеть EfficientNet называется Учителем. Затем они обучили более крупную сеть EfficientNet, называемую студентом, обучаясь классифицировать как ImageNet, так и изображения с новыми метками. Они повторяют этот процесс, используя более крупную сеть EfficientNet в качестве учителя, то есть повторно маркируют набор данных из 300 млн немаркированных изображений. Во время обучения студента они вводили в него шум, такой как увеличение данных, отсев, стохастическая глубина, так что студенческая нейронная сеть вынуждена усерднее учиться с помощью псевдометок. Но во время псевдо-маркировки 300M немаркированных изображений учитель не слышит шума, чтобы псевдо-метки были как можно лучше. Эти исследователи подчеркнули, что основное различие между [их] работой и предыдущими работами состоит в том, что [они] определяют важность шума и агрессивно вводят шум, чтобы ученик стал лучше. Следующие результаты показывают влияние шума на результаты сети:

Вам нужны услуги по обработке и анализу данных для вашего бизнеса? Вы хотите подать заявку на работу в области науки о данных в Sicara? Не стесняйтесь обращаться к нам, мы будем рады приветствовать Вас в нашем офисе в Париже.

Эта статья изначально была опубликована в блоге Sicara:
https://www.sicara.ai/blog/11-2019-best-of-ai-november-2019

Прочтите октябрьский выпуск
Прочтите сентябрьский выпуск
Прочтите июльский выпуск
Прочтите июньский выпуск

Некоторые статьи, которые мы недавно опубликовали в нашем блоге:

Детекторы лиц: понимание DSFD и современных алгоритмов
Определение гиперпараметров вашей сети с помощью байесовской оптимизации
Глубокое обучение использования памяти и приемы оптимизации Pytorch