Простое количественное сравнение тенденций в журналистике искусственного интеллекта и исследованиях искусственного интеллекта

Мы часто слышим, что в исследованиях искусственного интеллекта (ИИ) произошел взрывной рост, что ИИ развивает головокружительную скорость. Вот гистограмма заголовков Guardian, содержащих слово ИИ, собранных с помощью Открытой платформы Guardian, когда я искал слово технология. Я насчитал 60 заголовков об ИИ за 2017 год. Я знал, что ИИ будет в тренде, но был удивлен, насколько сильна эта тенденция.

Когда мы смотрим на публикации по информатике в исследованиях, можно подумать, что существует аналогичная тенденция в новых и появляющихся методах искусственного интеллекта, но это не совсем так. В городе появился один большой очевидный новичок, глубокое обучение. Ниже мы увидим, что с 2012 года глубокое обучение превратилось из неиспользуемого термина во фразу, которая доминирует в исследованиях в областях искусственного интеллекта, обработки естественного языка, компьютера. видение и машинное обучение. Глубокое обучение популярно в академических публикациях, так же как ИИ в газетах.

Исследования - это не революция в области искусственного интеллекта, это революция в области глубокого обучения.

Различие между ИИ и глубоким обучением важно. Термин ИИ ассоциируется со всеобъемлющей технологией, которую можно применить ко всему и ко всему. Глубокое обучение - это развивающийся метод машинного обучения, который, как и любая другая технология, имеет свои сильные и слабые стороны. Он полностью изменил некоторые проблемы, такие как распознавание изображений и языковой перевод, но в некоторых других областях он неприменим.

Ниже я использую данные из arXiv, чтобы предположить, что интерес СМИ к ИИ обусловлен достижениями в области глубокого обучения. Некоторым это может показаться очевидным выводом, но помните, что это не обязательно очевидно для всех. Более того, важно убедиться, что наша интуиция подкрепляется данными и наблюдениями. Даже если для вас это не новость, я подозреваю, что вам будет интересно узнать, насколько сильна эта тенденция в глубоком обучении.

Все результаты в этой статье могут быть воспроизведены с помощью этого репозитория GitHub.

Набор данных

ArXiv - бесплатное и открытое хранилище препринтов журналов, одобренных к публикации после модерации. Именно здесь многие компьютерные ученые делятся своими исследованиями, чтобы обеспечить свободный и справедливый доступ к своей работе.

Давайте возьмем заголовки arXiv публикаций по информатике с тегами любой из следующих категорий, имеющих отношение к ИИ (см. Полный список тегов здесь):

  • Искусственный интеллект
  • Вычисления и язык (Computational Linguistics and Natural Language and Speech Processing)
  • Компьютерное зрение и распознавание образов
  • Машинное обучение
  • Нейронные и эволюционные вычисления

Я взял названия всех публикаций с этими тегами и год публикации. Затем я просто искал, какие слова менялись с течением времени. Опять же, все подробности на GitHub

Здесь стоит отметить, что, в отличие от газетных заголовков, термин ИИ редко используется, если вообще используется, в исследованиях. Только 138 из 43244 статей использовали в заголовке «ИИ» или «искусственный интеллект». Слишком мало заголовков, чтобы увидеть какие-либо значимые тенденции.

Полученные результаты

Нечеткая логика и логическое программирование были основными продуктами в конце девяностых - начале 21 века. На рис. 2 мы видим устойчивую долю публикаций arXiv, содержащих слово «логика» в названии, которая в последние годы сократилась.

Судя по рис. 3, эволюционные алгоритмы и эволюционное программирование также не имеют особого тренда.

Считайте рисунки 2 и 3 базовыми. Несмотря на то, что у них есть свои тенденции, здесь нет ничего особенно интересного в 2012–2014 годах, когда ИИ начал набирать популярность в журналистике. Помните об этом, когда мы исследуем данные, связанные с глубоким обучением.

Когда мы строим гистограмму документов arXiv, содержащих слово «глубокий», происходит совершенно другая история (рисунок 4). Как и в случае с заголовками Guardian, я подозревал, что будет тенденция к глубокому обучению, но я не ожидал увидеть что-то столь драматичное, как это.

Научные публикации, содержащие слово «глубокий», подозрительно похожи на газетные заголовки, содержащие «ИИ».

Следующие десять слов и биграмм (все они тесно связаны с глубоким обучением) показали наибольший рост использования с 2012 года, согласно набору данных arXiv:

«Глубокое обучение» «обнаружение» «сверточная нейронная сеть» «изображение» «нейронные сети» «сверточные» «нейронные» «сети» «обучение» «глубокое»

и следующие 10 слов стали меньше всего употребляться:

«Логика» «системы» «программирование» «алгоритм» «информация» «ограничение» «алгоритмы» «теория» «язык» «сложность»

Когда мы берем набор фраз, связанных с глубоким обучением, таких как «глубокий», «состязательный» или «сверточный», мы получаем еще более четкую картину, как на рисунке 5. Похоже, что более 1 из 5 отобранных публикаций могут быть связаны с глубоким обучением.

Выводы

С 2012 года ландшафт исследований в области искусственного интеллекта изменился. После 2012 года ландшафт стал гораздо более сосредоточенным на одной теме - глубоком обучении. Следуя невероятно быстрым восходящим тенденциям, продемонстрированным выше, глубокое обучение будет насыщать исследования в области ИИ в ближайшие несколько лет, если эта тенденция сохранится.

Очевидная корреляция между ИИ в новостях и глубоким обучением в исследованиях предполагает, что глубокое обучение стимулирует интерес СМИ. Несомненно, приложения глубокого обучения, такие как альфа-переход, сети передачи стилей и перевод изображений, по понятным причинам захватили воображение людей. Достижения в области глубокого обучения лучше всего отражаются в таких продуктах, как Google Translate, Siri, Alexa и средствах визуального поиска, но глубокое обучение - не серебряная пуля.

Хотя глубокое обучение будет продолжать делать огромные успехи в одних областях, менее вероятно, что они окажут влияние на другие, наиболее очевидно те, где невозможно собрать гигантские объемы обучающих данных. Глубокое обучение также не способно имитировать человеческое поведение в целом, даже если оно добилось прогресса в решении узких проблем, обычно связанных с людьми, таких как языковой перевод.

Если мы не понимаем сильные и слабые стороны глубокого обучения и различия между глубоким обучением и ИИ, мы рискуем разрывом между ожиданиями и реальностью, а также между исследователями и журналистами.

Я оставлю вам 5 заголовков и 5 публикаций в формате arXiv, выбранных случайным образом, чтобы дать представление о наборе данных.

Генеративное обучение для глубоких сетей

Вы бы сделали ставку против секс-роботов? ИИ «может оставить половину мира без работы»

Алгоритмы: жуткий контроль ИИ должен быть открыт для проверки

Искусственный интеллект, беспилотные автомобили и кибервойна - технологические тенденции, на которые стоит обратить внимание в 2017 году

О взаимодействии сетевой структуры и градиентной конвергенции в глубоком обучении

Обзор The Robot Will See You Now - похоже, даже терапевты могут потерять работу из-за искусственного интеллекта

MUFold-SS: Прогнозирование вторичной структуры белка с использованием сетей Deep Inception-Inside-Inception

Создание эмоциональных машин: распознавание эмоций изображения с помощью глубоких нейронных сетей

Ученые ИИ хотят создавать богов. Это должно нас беспокоить?

Сбор дискриминирующих метаобъектов с глубокими функциями CNN для классификации сцен