Интервью с Ариндамом Палом, старшим научным сотрудником CSIRO

Позвольте мне поприветствовать Ариндама Пала на сегодняшнем интервью. Ариндам - старший научный сотрудник Data61 в CSIRO. Он также является научным сотрудником Совместного исследовательского центра кибербезопасности. До этого он был научным сотрудником в компании TCS Research and Innovation. Он также имеет опыт работы в Microsoft, Yahoo Research Labs и IBM Research Labs. В прошлом Ариндам занимал должность приглашенного ученого в Университете Калабрии.

Научные интересы Ариндама лежат в области алгоритмов, кибербезопасности, сетевых наук, машинного обучения и оптимизации. Он опубликовал высококачественные статьи на нескольких ведущих конференциях и в журналах. Чтобы узнать о нем подробнее, отметьте здесь.

Я хотел бы от всей души поблагодарить Ариндама за то, что он нашел время для этого интервью. Я надеюсь, что это интервью послужит цели для улучшения сообществ специалистов по науке о данных и машинного обучения в целом :)

Интервью с Ариндамом Палом, старшим научным сотрудником CSIRO

Саяк: Привет, Ариндам! Спасибо за интервью. Рад видеть вас здесь сегодня.

Ариндам: Спасибо, Саяк, за приглашение. Я рад поговорить с вами.

Саяк: Может быть, вы могли бы начать с того, чтобы представиться - какова ваша текущая работа и каковы ваши обязанности там?

Ариндам: я старший научный сотрудник Data61 в Содружестве научных и промышленных исследований организации (CSIRO) и научный сотрудник Совместного исследовательского центра кибербезопасности. Для тех из вас, кто не знает о CSIRO, это национальное научно-исследовательское агентство Австралии. Мы решаем самые сложные задачи с помощью инновационной науки и технологий. Я работаю над применением алгоритмов машинного обучения для решения проблем кибербезопасности. Некоторые из проблем - это обнаружение мошенничества, обнаружение аномалий, обнаружение выбросов и моделирование поведения пользователей.

Саяк: Моя бакалаврская диссертация была посвящена использованию машинного обучения в кибербезопасности (в частности, обнаружении вторжений). Это такое прекрасное поле. Мне любопытно, как вы заинтересовались машинным обучением?

Ариндам: С детства я очень интересовался математикой и естественными науками. Когда я изучал информатику и инженерию во время учебы в бакалавриате, я заинтересовался алгоритмами. Алгоритмы - это методы точного пошагового решения математической задачи. Во время моей докторской в ИИТ Дели я работал над поиском приближенных решений сложных задач комбинаторной оптимизации, таких как планирование заданий на машине и маршрутизация транспортных средств в дорожной сети. Эти проблемы очень интересны, и их сложно решить. Во время курсовой работы я прошел курс машинного обучения. Я был очарован различными типами задач, которые можно решить с помощью алгоритмов машинного обучения, которые нельзя решить с помощью традиционных алгоритмов. Я сделал курсовой проект в MATLAB, который вселил в меня уверенность в решении задач машинного обучения.

Саяк: Это приятно знать. Спасибо, что поделился этим, Ариндам. Когда вы начинали работать в этой области, с какими проблемами вы столкнулись? Как вы их преодолели?

Ариндам: Когда я начал работать над проблемами машинного обучения, для изучения этого предмета было не так много книг и курсов. Кроме того, было непросто найти хорошие наборы данных. Я протестировал большинство своих алгоритмов на наборах данных, приведенных в Репозитории машинного обучения UCI. Я задавал много вопросов на Stack Exchange. Затем стали доступны многие другие ресурсы. Появились Coursera и edX. Я прошел курс машинного обучения Эндрю Нг, чтобы больше узнать об этом предмете. Kaggle начал предлагать наборы данных и проводить испытания и соревнования. Я также принял участие в некоторых испытаниях Topcoder и Google Code Jam, чтобы отточить свои навыки.

Я прошел курс машинного обучения Эндрю Нг, чтобы больше узнать об этом предмете. […] Я также принял участие в некоторых испытаниях Topcoder и Google Code Jam, чтобы отточить свои навыки.

Саяк: Это действительно вдохновляет. С другой стороны, я бы сказал, что курс Эндрю Нга стал отправной точкой в машинное обучение для целого поколения. Какие из главных проектов вы реализовали в годы становления?

Ариндам: За эти годы я сделал много интересных и сложных проектов. Вот некоторые из них, которые я хотел бы выделить.

Планирование эвакуации из больших зданий
Анализ научных публикаций и патентов с помощью машинного обучения
Юридическая аналитика данных и майнинг
Анализ взаимозависимых сетей
Автоматизация складов с помощью робототехники

Саяк: Я помню, как читал вашу работу по анализу научных публикаций и патентов с машинным обучением во время работы в TCS Research. Это определенно было что-то новое и очень интересное. Ваша исследовательская карьера до сих пор была такой захватывающей. Вы бы хотели поделиться своими мыслями с начинающими исследователями? Вы также можете пролить свет на свой подход к проведению эффективных исследований.

Ариндам. Самое важное при проведении исследования - это любовь к предмету и увлеченность им. Если вам не нравится то, что вы делаете, вы никогда не добьетесь успеха (разве это не правда обо всем, что мы делаем в жизни?). Также нужно очень много работать. Ничего не дается легко в исследованиях. Вам нужно попробовать много разных вещей, прежде чем вы сможете придумать новый алгоритм, который даст лучшее решение вашей проблемы. Вы должны опробовать его на множестве различных наборов данных, чтобы быть уверенным, что он действительно хорошо работает как в теории, так и на практике.

Я хотел бы изложить алгоритм великого физика Ричарда Фейнмана для решения проблемы. Есть три шага.

Запишите проблему.
Подумайте очень хорошо.
Запишите решение.

Теперь ключевая часть - «хорошенько подумай». Как вы относитесь к новой проблеме, о которой не имеете большого представления? Вот как вы это делаете. Постарайтесь понять структуру проблемы. Посмотрите, можете ли вы подумать о проблеме, которую вы знаете, которая похожа на текущую проблему, которую вы пытаетесь решить. Если вы можете его найти, вы почти закончили. Большинство из нас находит решения новой проблемы, сводя ее к одной или нескольким известным проблемам. Это похоже на алгоритм k-ближайшего соседа в классификации. Вы говорите, что изображение - это кошка, если оно похоже на изображение, которое, как вы знаете, изображает кошку.

Большинство из нас находит решения новой проблемы, сводя ее к одной или нескольким известным проблемам. Это похоже на алгоритм k-ближайшего соседа в классификации. Вы говорите, что изображение - это кошка, если оно похоже на изображение, которое, как вы знаете, изображает кошку.

Саяк: Какая потрясающая аналогия и уникальный способ решения проблем! Я удивлен! За эти годы вы работали во многих разных областях. В чем секрет того, что помогло вам быть последовательными и продуктивными на протяжении всего этого пути?

Ариндам: Действительно, за последние 20 лет я работал над множеством разных областей. Я работал инженером-программистом в Microsoft и других компаниях-разработчиках программного обеспечения, где раньше писал много промышленного кода. Теперь я больше сосредоточен на дизайне и исследованиях. Я также работал над множеством различных типов проблем: комбинаторной оптимизацией, разработкой программного обеспечения, искусственным интеллектом, машинным обучением и кибербезопасностью. Некоторые из них в высшей степени математичны, тогда как другие гораздо более практичны. Я думаю, что моя страсть к компьютерам, науке, технологиям и математике побудила меня работать в таких разнообразных областях и оставаться последовательным и продуктивным на протяжении всего этого долгого и насыщенного событиями пути.

Я думаю, что моя страсть к компьютерам, науке, технологиям и математике побудила меня работать в таких разнообразных областях и оставаться последовательным и продуктивным на протяжении всего этого долгого и насыщенного событиями пути.

Саяк: Такие области, как машинное обучение, быстро развиваются. Как вам удается отслеживать последние важные события?

Ариндам: я читаю много книг, статей, новостных статей и блогов, чтобы быть в курсе последних исследований и разработок в области машинного обучения. Чтобы оставаться в курсе, нужно много читать. Я хожу на различные конференции, семинары и встречи. Я посещаю доклады профессоров и исследователей. Я выступаю с докладами и обсуждаю свои идеи с моими коллегами и коллегами-исследователями.

Саяк: Я занимаюсь практикой и часто сталкиваюсь с проблемой изучения новой концепции. Вы бы хотели поделиться своим подходом к этому процессу?

Ариндам: усвоить новую концепцию сложно для всех, а не только для вас. Правильный подход к этому - подумать о том, как вы можете связать эту новую концепцию с существующими концепциями, которые вам уже известны. Как только вы сможете установить связи между ними, вам станет намного легче изучить новую концепцию.

Правильный подход к этому (изучение новой концепции) - подумать о том, как вы можете связать эту новую концепцию с существующими концепциями, которые вы уже знаете. Как только вы сможете установить связи между ними, вам станет намного легче изучить новую концепцию.

Саяк: коннекционизм почти всегда работает во всем. Есть какие-нибудь советы новичкам?

Ариндам: на мой взгляд, самое важное, что нужно помнить, - это то, что вы должны четко понимать, что вы делаете. Не относитесь к этим алгоритмам машинного обучения и глубокого обучения как к черным ящикам. Вы должны знать, как работают эти алгоритмы, наизнанку. Ошибка, которую совершают многие молодые люди, заключается в том, что они используют некоторые библиотеки, такие как TensorFlow или PyTorch, и думают, что эти библиотеки автоматически решат все их проблемы. Вы должны хорошо понимать технические и бизнес-аспекты проблем, чтобы их решать.

… Самое главное помнить, что вы должны четко понимать, что вы делаете. Не относитесь к этим алгоритмам машинного обучения и глубокого обучения как к черным ящикам.

Саяк: Большое спасибо, Ариндам, за это интервью и за то, что поделились своими ценными идеями. Я надеюсь, что они будут очень полезны сообществу.

Ариндам: Было приятно поговорить с тобой, Саяк. Я надеюсь, что это интервью пойдет на пользу молодым исследователям, которые пытаются построить карьеру в области машинного обучения.

Резюме

То, как Ариндам сводит новую проблему к уже существующей, - это то, что я определенно пробую в своей работе (и вам тоже стоит!). Последовательность и продуктивность Ариндама являются побочными продуктами его глубокой страсти к компьютерам, науке, технологиям и математике. Удивительно и воодушевляюще видеть, что это слияние позволило ему добиться до сих пор. Редкий опыт Ариндама в сочетании исследований и прикладных принципов также является поводом для размышлений.

Надеюсь, вам понравилось читать это интервью. Следите за этим местом для следующего, и я надеюсь увидеть вас в ближайшее время. Здесь где можно найти все интервью, сделанные на данный момент.

Если вы хотите узнать обо мне больше, загляните на мой сайт.

Интервью с Ариндамом Палом, старшим научным сотрудником CSIRO

Интервью с Ариндамом Палом, старшим научным сотрудником CSIRO

Резюме

Вопросы по теме