Я впервые буду присутствовать на ICML в этом году и хотел немного глубже изучить принятый список работ в качестве подготовки. ICML - одна из крупнейших академических конференций по машинному обучению, наряду с NIPS, ICLR и другими.
В прошлом году директор Tesla по искусственному интеллекту Андрей Карпати опубликовал похожий пост с подробным описанием общепринятой бумажной статистики за 2017 год. Это послужило источником вдохновения для этой работы и может использоваться в качестве точки для сравнения со статистикой этого года.
Наиболее упоминаемые учреждения
Первым делом я проверил, какие учреждения чаще всего упоминаются в газетах. Я использовал python, регулярное выражение и вручную разрешал конфликты имен (то есть сворачивал «Google Inc», «Google Brain» и т. Д. В «Google»). Название каждого института учитывалось только один раз для каждой статьи, поэтому мы смотрим на количество упоминаний в статьях, а не на количество авторов из каждого института.
В общей сложности мы получаем ~ 480 уникальных упоминаний организаций по сравнению с 420 в прошлом году. Общее количество принятых работ составило 621, что указывает на то, что ~ 141 статья была согласована между учреждениями.
Ниже перечислены 30 лучших институтов с их подсчетом.
Count Institute ----------------- 51 Google 29 UC Berkeley 29 Carnegie Mellon University 28 MIT 28 Deepmind 26 Stanford 25 Microsoft 21 Facebook 21 University of California 19 University of Oxford 17 Princeton 16 Cornell University 15 University of Toronto 15 UT Austin 14 ETH Zurich 14 École polytechnique fédérale de Lausanne 14 University of Cambridge 11 Georgia Tech 11 Duke University 11 Columbia University 10 University of Southern California 10 Amazon 10 Uber 10 Tsinghua University 10 Harvard 9 INRIA 9 Purdue University 8 Johns Hopkins University 8 Yale University 8 Madison
Промышленность против академических кругов
Чтобы получить лучшее представление об отраслевом и академическом представительстве на ICML, я посмотрел на процентное соотношение отраслевых и академических авторов в 10 ведущих институтах.
Из статей, относящихся к 10 ведущим институтам, в 45% статей упоминаются отраслевые авторы.
Рассматривая участие Alphabet в подсчете статей для 10 ведущих институтов, я обнаружил, что
Google и DeepMind упоминаются в 28% статей.
Что еще удивительнее, так это то, что
Google и DeepMind упоминались почти в 13% всех документов, принятых на ICML.
Это выше прошлогодних 6,3%: явный признак того, что Alphabet успешно продолжает масштабировать свои исследования в области машинного обучения. Это особенно распространено, если учесть, что, как и в прошлом году, академические круги упоминаются примерно в 75% статей. Таким образом, авторы из академических кругов примерно сохраняют свое сильное представительство на этой конференции.
Было бы интересно продолжать публиковать этот анализ на протяжении многих лет и наблюдать за изменением тенденций. Я также хотел бы провести тематическое моделирование на основе рефератов принятых статей с течением времени, чтобы выявить тенденции в распространенности различных тем исследований.
Если вы обнаружите какие-либо ошибки, читая это, оставьте, пожалуйста, комментарии, и я исправлю их в ближайшее время!