Недавно я наткнулся на отличное видео профессора Эндрю Нг, который объясняет перед классом CS в Стэнфорде, как можно преуспеть в области искусственного интеллекта.

Я перефразирую его слова ниже.

Глубокое обучение развивается достаточно быстро, поэтому, даже если вы изучили основы глубокого обучения, когда вы работаете над конкретными приложениями, вам нужно читать исследовательские статьи, чтобы оставаться в курсе самых последних идей.

Проф. Нг делится простой и довольно эффективной техникой планирования чтения. Он включает следующие шаги:

  • Выберите интересующую вас тему (например, распознавание речи, обобщение текста, создание изображений с помощью GAN).
  • Составьте список из 10–20 статей / статей / сообщений в блоге.
  • Постепенно расширяйте этот список до 50+ статей.

Кроме того, он предложил несколько мест для поиска ресурсов, включая Twitter, Subreddit машинного обучения, NIPS, ICML и ICLR (последние 3 - конференции по машинному обучению).

Следуя этой методике, у меня возник вопрос:

Сколько времени и сил нужно, чтобы найти ПРАВИЛЬНУЮ коллекцию бумаг?

Посвятив несколько часов и, наконец, сумев найти набор документов и статей моего желания, я решил поделиться своим опытом и помочь другим в этом путешествии.

Как начать?

Самый первый шаг - это решить конкретную тему / проблему. В моем случае мне было интересно узнать больше о том, как глубокое обучение можно применить для оценки кредитного риска для любого типа кредита (ипотека, личный заем, кредитная карта и т. Д.)

Когда у вас есть тема, можно перечислить все ключевые слова, связанные с ней. Для меня это были: кредит, ссуда, кредитование, ипотека, риск, оценка, оценка, банковское дело, финансы.

Когда вы ищете статью / статью / сообщение в блоге, объедините эти ключевые слова с «глубоким обучением», «машинным обучением» или «нейронными сетями», чтобы получить необходимые результаты.

Исследуйте Интернет в поисках ресурсов

На поиск нужных ресурсов может уйти от 1 часа до 1-2 дней. Это действительно зависит от того, насколько вы полны решимости найти «идеальный» набор бумаг. Однако следует избегать ненужных затрат времени на исследования, и, если он / она найдет 3–4 статьи, можно начинать собственно чтение. Ниже перечислены несколько эффективных способов поиска ресурсов.

  • Стандартный поиск Google

Для любого очевидно, что поиск в Google по вышеуказанным ключевым словам - это первый шаг. К сожалению, я не нашел этот подход настолько эффективным, поскольку часто результаты включают не фактические решения, а скорее обзор темы, адаптированный для любого читателя.

Однако, если вы выполните поиск в Google Scholar, вероятность найти то, что вам нужно, намного выше.

  • Ознакомьтесь с лучшими конференциями по машинному обучению

Второй шаг - просмотреть все заголовки конференций прошлых лет и выделить то, что звучит интригующе. Например, заглянем на Конференцию НИПС и попробуем найти список представленных докладов.

  • Сначала перейдите на https://nips.cc/ и измените год с 2019 на 2018, 2017 и т. Д.

  • Наконец, просмотрите разделы и выберите статьи, относящиеся к вашей теме.

На веб-сайтах других конференций также хранятся «Книги для мастерских», которые вы можете получить аналогичным образом.

  • Поиск в библиотеках самых популярных научных статей в Интернете

В список таких сайтов входят arxiv.org, Semantic Scholar, Science Direct и другие. Используйте заранее определенные ключевые слова вместе с опцией Расширенный поиск на каждой платформе, чтобы найти интересный материал.

Примечание: некоторые документы могут быть частными и требуют покупки. Имейте в виду, что если вы студент (из любого университета), вам разрешен доступ к этим работам БЕСПЛАТНО. Возможно, вы сможете войти в систему с учетными данными учащегося и получить файлы PDF. В противном случае обратитесь в свою школу за дальнейшими инструкциями.

Погрузитесь глубоко в бумагу

Процесс поиска набора статей, идеально соответствующих вашей теме, может быть утомительным и трудоемким. Скорее всего, вы найдете статьи по теме (в тех же или соседних полях), но не совсем то, что вам нужно.

Не забывайте, что исследователи создают свою работу на основе предыдущих выводов, и каждая статья включает множество ссылок.

Вот как я использовал приведенное выше утверждение, чтобы найти то, что мне нужно:

  1. Изучив книгу семинара NIPS 2018, я обнаружил отличный семинар под названием «Проблемы и возможности ИИ в финансовых услугах: влияние справедливости, объяснимости, точности и конфиденциальности».
  2. Большинство работ посвящено не оценке кредитоспособности, а новым способам сделать модели глубокого обучения, используемые в финансовом секторе, более понятными.
  3. Я подумал, что для того, чтобы авторы обсуждали объяснимость модели, они должны были посмотреть (и процитировать) реальный алгоритм. Удивительно, но я обнаружил, что самые первые 3–4 ссылки - именно то, что мне нужно.

Такой подход помог мне расширить список ресурсов и найти действительно полезный материал.

Фильтр шума

В этом заключительном разделе я хочу остановиться на нескольких вещах, на которые я обращаю внимание при выборе конкретной бумаги. Это помогает мне фильтровать большую часть шума и позволяет сосредоточиться на меньшем количестве источников, но более высокого качества.

  • Авторы - статьи могут публиковаться разными исследователями, специализирующимися в разных областях. Обычно я ищу имена авторов и название учреждения в LinkedIn или Twitter. Например, работа по оценке кредитного риска с использованием глубокого обучения, написанная исследователями из крупного банка / финансового учреждения, является хорошим местом для качественного материала. Кроме того, в хороших школах (Стэнфорд, Массачусетский технологический институт, Университет Монреаля) и компаниях (Facebook, Google, Baidu) обычно работают самые сильные исследователи.
  • Дата публикации - область глубокого обучения быстро развивается, поэтому статья, написанная 5 лет назад, может быть неактуальной сегодня. Я стараюсь искать более свежий материал, но никогда не пренебрегаю хорошей бумагой из давних времен, особенно если она представляет собой прорывную технику.
  • Количество цитирований - если статья не цитировалась, это часто не означает, что это некачественный материал. Я часто смотрю на количество цитирований, чтобы понять популярность газеты, но это никогда не является решающим фактором.

На этом я завершаю свой подход к эффективному поиску исследовательских работ и статей. Если у вас есть какие-либо комментарии или предложения, не стесняйтесь делиться ими в разделе комментариев.

Спасибо за чтение. Надеюсь, вам понравилась статья 🤩, и желаю вам отличного дня!