Я впервые буду присутствовать на ICML в этом году и хотел немного глубже изучить принятый список работ в качестве подготовки. ICML - одна из крупнейших академических конференций по машинному обучению, наряду с NIPS, ICLR и другими.

В прошлом году директор Tesla по искусственному интеллекту Андрей Карпати опубликовал похожий пост с подробным описанием общепринятой бумажной статистики за 2017 год. Это послужило источником вдохновения для этой работы и может использоваться в качестве точки для сравнения со статистикой этого года.

Наиболее упоминаемые учреждения

Первым делом я проверил, какие учреждения чаще всего упоминаются в газетах. Я использовал python, регулярное выражение и вручную разрешал конфликты имен (то есть сворачивал «Google Inc», «Google Brain» и т. Д. В «Google»). Название каждого института учитывалось только один раз для каждой статьи, поэтому мы смотрим на количество упоминаний в статьях, а не на количество авторов из каждого института.

В общей сложности мы получаем ~ 480 уникальных упоминаний организаций по сравнению с 420 в прошлом году. Общее количество принятых работ составило 621, что указывает на то, что ~ 141 статья была согласована между учреждениями.

Ниже перечислены 30 лучших институтов с их подсчетом.

Count Institute
-----------------
51 Google
29 UC Berkeley
29 Carnegie Mellon University
28 MIT
28 Deepmind
26 Stanford
25 Microsoft
21 Facebook
21 University of California
19 University of Oxford
17 Princeton
16 Cornell University
15 University of Toronto
15 UT Austin
14 ETH Zurich
14 École polytechnique fédérale de Lausanne
14 University of Cambridge
11 Georgia Tech
11 Duke University
11 Columbia University
10 University of Southern California
10 Amazon
10 Uber
10 Tsinghua University
10 Harvard
9 INRIA
9 Purdue University
8 Johns Hopkins University
8 Yale University
8 Madison

Промышленность против академических кругов

Чтобы получить лучшее представление об отраслевом и академическом представительстве на ICML, я посмотрел на процентное соотношение отраслевых и академических авторов в 10 ведущих институтах.

Из статей, относящихся к 10 ведущим институтам, в 45% статей упоминаются отраслевые авторы.

Рассматривая участие Alphabet в подсчете статей для 10 ведущих институтов, я обнаружил, что

Google и DeepMind упоминаются в 28% статей.

Что еще удивительнее, так это то, что

Google и DeepMind упоминались почти в 13% всех документов, принятых на ICML.

Это выше прошлогодних 6,3%: явный признак того, что Alphabet успешно продолжает масштабировать свои исследования в области машинного обучения. Это особенно распространено, если учесть, что, как и в прошлом году, академические круги упоминаются примерно в 75% статей. Таким образом, авторы из академических кругов примерно сохраняют свое сильное представительство на этой конференции.

Было бы интересно продолжать публиковать этот анализ на протяжении многих лет и наблюдать за изменением тенденций. Я также хотел бы провести тематическое моделирование на основе рефератов принятых статей с течением времени, чтобы выявить тенденции в распространенности различных тем исследований.

Если вы обнаружите какие-либо ошибки, читая это, оставьте, пожалуйста, комментарии, и я исправлю их в ближайшее время!