Йоханнес Гиоргис - старший инженер по данным в Loop Insights. Его история увлекательна, как он прошел путь от большой компании до быстро развивающегося стартапа, основанного на данных. Я познакомился с Джонни, когда мы вместе проходили курс глубокого обучения Nanodegree в Udacity. С тех пор мы поддерживаем связь. За последние несколько лет знакомства с Джонни я понял, что тихая вода течет глубоко - подходящая пословица для него. Он делится своими знаниями в своем блоге. Проходя с ним собеседование, он подробно рассказывает, как важно для людей понимать, где их модели машинного обучения вписываются в более крупную схему программной системы.

Чтобы узнать больше о подобном вдохновении:



Как сказать« нет проектам в области науки о данных?
Сайкат объясняет структуру, которую он использует для определения ценностного предложения проектов в области науки о данных, и говорит нет medium.com »





« Простота - это слава самовыражения - Интервью с Джаладжем Танаки (раздача электронных книг)
Всегда помните, что ваши навыки, связанные с наукой о данных, ваши проекты и ваш вклад останутся с вами навсегда итак… medium.com »





« Использование колледжа для правильного начала карьеры - Интервью с Джесси Штайнвег-Вудсом, доктором наук,
Я бы проигнорировал тех, кто говорит, что вам абсолютно необходимо знать инструменты больших данных / глубокое обучение сразу же, потому что большинство… medium.com »



Вимарш Карбхари (ВК): Какие три лучшие книги об AI / ML / DS вам понравились больше всего? Какие книги оказали наибольшее влияние на вашу карьеру?

Йоханнес Джорджис (JG):

Искусственный интеллект: современный подход открыл глаза на область искусственного интеллекта. Я прочитал эту книгу еще тогда, когда впервые был зарегистрирован в Udacity's Artificial Intelligence Nanodegree.

В настоящее время я читаю Разработка приложений, интенсивно использующих данные: главные идеи, лежащие в основе надежных, масштабируемых и обслуживаемых систем. Это отличный ресурс для создания систем, использующих приложения, управляемые данными.

Следующим в моем списке идет Наука о данных с нуля - я восхищен этой книгой, поскольку в ней основное внимание уделяется базовым алгоритмам, которые сегодня используются во многих науках о данных. Переписывание этих алгоритмов и их применение в контексте работы нового специалиста по данным в компании дает нам более глубокую перспективу, которую мы теряем, полагаясь на функции библиотек более высокого уровня.

ВКонтакте: Какие инструменты (программное обеспечение / оборудование / привычки), которыми вы пользуетесь как специалист по анализу данных, оказывают наибольшее влияние на вашу работу?

JG: Панды! Я всегда рад использовать свои навыки Pandas для очистки, форматирования и изучения наборов данных. Недавно я начал изучать Docker для решения веб-задач на работе. Я надеюсь включить его в свой рабочий процесс / набор инструментов в области науки о данных, чтобы помочь мне создать воспроизводимое рабочее пространство для разработки в области науки о данных. Возможность быстро поделиться средой, в которой вы построили модель, - огромное преимущество.

ВКонтакте: Не могли бы вы рассказать о неудачах / проектах / экспериментах, связанных с наукой о данных, из которых вы узнали больше всего?

JG: Я и мой друг (Эндрю) собрались вместе, чтобы изучить соответствующие технические встречи в наших городах - Ванкувер и Сан-Франциско. Сначала мы изучили API Meetup, чтобы увидеть, что он позволяет нам делать. Исходя из этого, мы создали несколько вспомогательных функций для получения данных для нескольких групп, преобразования их в фреймы данных Pandas, чтобы мы могли двигаться дальше с очисткой и исследованием данных. Прыжок прямо к проблеме, поиск достаточного количества документации, руководств, способных продвинуть вас на дюйм вперед, было бесценным уроком. Я часто оказываюсь в аду обучающих программ, где не могу применить то, что я только что узнал, ни к чему, что поможет мне сохранить это.

Сосредоточившись на проекте или проблеме, которые мне интересно изучить или решить, я не зацикливаюсь на учебных пособиях. - Джонни

ВК: Если бы вы писали книгу, как бы она называлась? Какие основные темы вы бы затронули в книге?

JG: Мне интересно написать книгу, в которой исследуется, как компания может расширить свои возможности обработки данных. От групп без обработки данных до некоторых или большого количества данных до полноценной инфраструктуры данных, которая обеспечивает аналитику и исследование с помощью машинного обучения. Затем вы перейдете на новый уровень и сможете эффективно использовать машинное обучение и искусственный интеллект для решения бизнес-задач.

Слишком много ресурсов сосредоточено на создании привлекательной части науки о данных / построения моделей машинного обучения, на которую специалисты по данным обычно тратят меньше всего времени. Большая часть времени уходит на сбор данных, их очистку и преобразование во что-то, что они действительно могут использовать. В реальном мире данные беспорядочные, их нет в одном месте и т. Д. Меня очаровывает возможность взять это и построить инфраструктуру данных, которая позволяет специалистам по данным, аналитикам и инженерам по машинному обучению выполнять свою работу.

С этим также связано развертывание систем машинного обучения / искусственного интеллекта. Опять же, множество ресурсов проведет вас через то, как построить модель, но недостаточно покажет вам, как сделать ее полезной - создать веб-приложение и развернуть его в heroku, докеризировать его и развернуть в облачной среде и т. Д. Эти системы будут реализованы только в том случае, если они станут доступными для людей, независимо от того, создаете ли вы побочный проект для развлечения или строите бизнес. Необязательно знать о масштабе, платформах машинного обучения и т. Д., Но это важный аспект, который нужно понимать, чтобы люди могли знать, где их модели машинного обучения вписываются в более крупную схему программной системы.

Идя рука об руку со всем этим, вы можете проповедовать организацию, чтобы она стала более управляемой данными, чтобы донести важность использования и наращивания возможностей данных до руководителей и лиц, принимающих решения.

ВКонтакте: С точки зрения времени, денег или энергии, какие самые лучшие инвестиции вы сделали, которые принесли вам совокупное вознаграждение в вашей карьере?

JG: Переехав в Ванкувер, я все еще изучая область искусственного интеллекта, встречи стали для меня бесценными. Я встретил так много людей, которые были на том же пути, что и я, у некоторых я мог учиться, а у других - помочь. Выйти и встретиться с людьми - отличный способ наладить контакт, понять проблемы, которые люди решают, и даже найти новые роли!

Конференции - это также отличная возможность для обучения и общения. Вы, как правило, находитесь в окружении людей, с которыми обычно не можете встретиться лично, поэтому воспользуйтесь преимуществом и соединитесь. Это также место, где можно более подробно узнать, над чем работают другие компании, с какими проблемами они столкнулись и как они их решили. В начале этого года я посетил Data Science Go в Сан-Диего и встретил много интересных и увлеченных людей. Я с нетерпением жду участия в следующем году, а также с нетерпением жду возможности посетить более подходящие конференции по данным.

Работа над проектом по собственному желанию, отдельно от онлайн-класса, также была очень полезной. Курсы отлично подходят для изучения основ и начала работы, но проекты позволяют вам глубоко погрузиться в работу и по-настоящему поразмыслить над тем, как выполнить работу с помощью приобретенных навыков. Я работал над проведением технических встреч в Ванкувере, собирал данные с нескольких страниц для создания собственного каталога и т. Д. Работая над этими проектами, я получаю больше идей о том, как их расширить, что, в свою очередь, требует от меня дополнительных навыков для добиться этого.

Подкасты - еще один ресурс, которым я трачу много времени. Есть много хороших подкастов, посвященных науке о данных, которые исследуют различные аспекты - практические приложения, теоретические статьи, способы построения карьеры, лидерство, этику, данные. инженерия и др.

ВКонтакте: Что улучшило вашу трудовую жизнь за последний год, что может принести пользу другим?

JG: Я присоединился к стартапу в начале этого года, поэтому я приспосабливаюсь к изменениям скорости, исходящим от гораздо более крупной компании. Каждая задача в стартапе может казаться приоритетом 1, поэтому способность расставлять приоритеты и сообщать о том, сколько времени они займут, - это важнейший навык, который мне нужно было развить.

ВКонтакте: Что вы посоветуете начинающим в этой сфере? Какой совет им следует игнорировать?

JG: Это совет, который я услышал во время посещения Data Science Go - сосредоточьтесь на той области, которая вас интересует. В частности, если вы не заинтересованы в работе с изображениями , не изучайте сверточные нейронные сети. Если вас не интересует маркетинг, не утруждайте себя изучением аналитики, связанной с маркетингом. Иногда легче понять, что нас не интересует, а не то, что нам интересно. Так что пройдите этот процесс, чтобы сузить области, которые могут быть вам интересны.

Эта область довольно обширна - хотя создаются более специализированные роли, специалист по данным может либо создавать инфраструктуру данных, строить модели машинного обучения, проводить аналитику, либо проводить статистические эксперименты, либо их комбинацию и многое другое. Хотя говорят о единороге, занимающемся полным стеком данных, вы должны понимать, что на это уйдут годы (если вы стремитесь сделать это хорошо).

Начни вести блог! Начните узнавать, как вы можете сообщить о своих выводах и проблемах в письменной форме. Делитесь тем, что вы изучаете. Подобно тому, как кто-то идет впереди вас, есть кто-то позади вас, кто может учиться у вас.

ВКонтакте: Как вы определяете, что отказываетесь от экспериментов / проектов?

JG: прямо сейчас я действительно заинтересован в создании проектов машинного обучения и искусственного интеллекта, которые окажут значимое влияние на бизнес.

Некоторые эксперименты / проекты выглядят круто с технической точки зрения, но не приносят немедленной выгоды для бизнеса. Это проекты, которым я отказываюсь. - Джонни

В настоящее время я работаю в компании по анализу данных, основанной на IoT. Наше устройство IoT находится в розничных магазинах в точках продаж - теоретически мы могли бы использовать его для предоставления услуг перевода между кассиром и покупателем. Было бы очень круто построить такую ​​модель, которая могла бы эффективно работать на периферии. Однако это не повлияет на бизнес, поскольку это не та бизнес-проблема, которую мы пытаемся решить.

ВКонтакте: По вашему мнению, какое организационное размещение является идеальным для группы данных?

JG: Это действительно зависит от обстоятельств. Опять же, еще один вывод, который я сделал из Data Science Go (я уже упоминал, что вы многому научились на конференциях :)), был из выступления, в котором основное внимание было уделено ролям группы Data Science, которая определяла, где эта команда находится в организации.

В зависимости от организации и ее потребностей, группы по анализу данных могут входить в группу инженеров, помогая им создавать конвейеры / продукты машинного обучения, или в централизованную / встроенную команду, служащую центром передового опыта в области науки и анализа данных, или в исследовательском отделе, изучающем следующее поколение продуктов ИИ и т. д.

ВК: Если бы вы могли переделать свою карьеру сегодня, что бы вы сделали?

JG: Я бы поработал над своими мягкими навыками раньше. Я бы присоединился к группе Toastmasters, начал бы посещать встречи и предложил выступить с докладами.

Наряду с этим, я бы сосредоточился на создании приложений в свободное время, оттачивая свои навыки разработки программного обеспечения, одновременно развивая свои навыки эксплуатации / облачной архитектуры и развертывания.

ВКонтакте: За какими онлайн-блогами / людьми вы следите, чтобы получить советы / узнать больше о DS?

JG: Ниже приведены некоторые из блогов, которые я читаю, и подкасты, которые я слушаю.

Блоги:
Acing AI :)
Навстречу науке о данных

Подкасты:
Практический AI
TWIML
Super Data Science
Подкаст Data Engineering
Data Science at Главная
Искусственный интеллект в промышленности
Скептик данных

Подпишитесь на нашу рассылку Acing AI, я обещаю не спамить и БЕСПЛАТНО!



Спасибо за внимание! 😊 Если вам понравилось, проверьте, сколько раз вы можете нажать 👏 за 5 секунд. Это отличное кардио для ваших пальцев, И оно поможет другим людям увидеть историю.