У каждого есть план, пока он не получит удар по лицу.

- Майк Тайсон

Начало 2017 г.

Мой карьерный удар в лицо был больше похож на повторяющиеся удары по корпусу, которые привели меня сюда, мой итог 2017 года.

Если вы отслеживали, примерно 8 месяцев назад, после тех повторяющихся ударов по телу, которые говорили мне, что я не на той карьерной лестнице, которую я любил, я уволился с работы и начал свой самостоятельный темп Учебный график машинного и глубокого обучения . В конце июля я начал поиск работы, и с тех пор, как получил должность в Format, я работал без перерыва, любя то, что я делаю, людей, с которыми я это делаю, и сообщество, для которого я это делаю.

Но давайте сделаем шаг назад. После этого путешествия (и написания об этом) я чувствую себя обязанным и нуждающимся в том, чтобы рассказать вам немного о моем поиске работы, почему я выбрал Format, чем я занимаюсь сейчас и что меня ждет в будущем.

Поиск работы

После 4 месяцев обучения и побочных проектов я почувствовал, что достаточно хорошо разбираюсь не только в основных принципах глубокого обучения, но, что более важно, в практическом применении этих методов. Одни компании так думали, другие - нет.

Компании, к которым я обращался, можно разделить на три группы: малые / стартапы, средние и крупные компании. Я объясню немного больше об этих трех группах, но сначала позвольте получить некоторые цифры: Применяется к: 19; Беседовали: 7; Отказался от продолжения: 2; Принято: 1

Две компании, с которыми я отказался продолжить процесс собеседования, были исключительно потому, что я не верил, что они подходят.

Однако некоторые компании ответили автоматическим электронным письмом и ссылкой с просьбой пройти тест. Я проигнорировал их просьбы. Извините, но если у вас нет времени хотя бы на то, чтобы кто-то написал электронное письмо или позвонил, зачем мне проходить ваш тест ??? Не из принципа, а из приличия. Подумайте про себя, хотите ли вы работать в компании, которая обслуживает своих потенциальных сотрудников автоматизированным…

Здравствуйте, я не удосужился прочитать ваше резюме, и меня не волнует, что я заставил вас заполнить нашу длинную онлайн-форму заявки с такими вопросами, как «скажите мне, что делает вас уникальным». Вместо этого докажи, что ты стоишь моего времени, займись этим проектом в СВОЕ время и возвращайся ко мне.

Нет, я не вернусь к тебе.

Startup vs Medium vs Enterprise

Размер имеет значение? Я обнаружил, что чем крупнее компания, тем более специализированной или узкой будет ваша сфера деятельности. Например, я проводил собеседование с представителями некоторых средних / крупных компаний, которые считали, что я лучше всего подходил в качестве аналитика данных, в то время как другие небольшие компании считали, что я идеально подхожу в роли инженера по машинному обучению. Кроме того, в более крупных компаниях вы можете ожидать большего от наставничества / обучения, но чем меньше компания, тем больше вам придется разбираться во всем самостоятельно. Учитесь на практике, неудачах и повторении. Вы должны знать себя, что вам нравится делать, а также знать, где вы хотите быть через 5 или 10 лет.

Итак, вот мой совет: не предполагайте, что должности в машинном / глубоком обучении будут носить название по имени. Прочтите описание вакансии, и вы, как и я, будете приятно удивлены, что многим компаниям нужны инженеры по машинному / глубокому обучению - они просто хотят, чтобы вы занимались и другими делами.

Формат

Начальный стартап из Торонто, помогающий художникам профессионально и красиво демонстрировать свои работы в их собственных онлайн-портфолио, разработанных для творческих умов.

Формату, как и типичному стартапу, занимающемуся начальной загрузкой, нужны люди с разносторонними талантами. Таким образом, роль инженера по данным, на которую я подал заявку, на самом деле была отчасти инженером по данным, отчасти аналитиком данных и отчасти инженером по машинному обучению. Я отлично справляюсь со всеми тремя ролями? Конечно нет! Но мой прошлый опыт, самостоятельная работа с машинным / глубоким обучением, готовность и способность осваивать новые технологии сделали меня идеальным (по моему мнению). На самом деле именно эта смесь ролей заставила меня так взволновать присоединение к компании, но на этом я не остановился. В отличие от многих других компаний, с которыми я беседовал, Format имел долгосрочные планы на эту роль, в том числе стать проповедником компании, желающей стать организацией, управляемой данными.

Моя текущая работа

Когда компания решает, что ей нужна группа данных, они, вероятно, начинают разбивать вещи на этапы и роли, пытаясь выяснить, сколько людей требуется и в каких ролях. Для многих это выглядит так:

  1. Сбор данных (разработчики)
  2. Хранение данных (группа по инфраструктуре данных)
  3. Анализ данных (Data Analytics / Data Science Team)
  4. Решения на основе данных (менеджеры)

Не обращая внимания на менеджеров, вам нужно 3 команды людей, но, как минимум, у вас может быть один человек для каждой команды:

  1. Инженер по данным, который может соответствовать вашим разработчикам с точки зрения инженерных навыков.
  2. Аналитик данных, знающий SQL, Python или R. И тот, кто может понять или, по крайней мере, оценить реальную бизнес-сторону компании.

Третий человек, которого я назначил инженером по данным, потому что, если вы не знаете или не можете изучить некоторые базовые технологии инфраструктуры данных, можете ли вы на самом деле называть себя инженером по данным ???

Однако, когда вы малы и находитесь на ранних этапах сбора и использования данных, можно обойтись только одним сотрудником, как я, группой данных из одного человека. Я активно участвую в этапах с 1 по 3, и как компания, начинающая свой путь к тому, чтобы стать организацией, управляемой данными, вы будете полагаться на то, что каждый человек в каждом отделе станет своим собственным аналитиком данных. Это, в свою очередь, немного облегчает мою нагрузку, по крайней мере, на ранних этапах использования ваших данных.

Что я на самом деле делаю

Через две недели я произвел свое первое развертывание продукта… на Ruby, языке, который я изучил в Format. Много шляп.

Моя первая работа в качестве единой группы данных - обеспечение согласованности данных, а во-вторых, содействие и пропаганда использования данных во всей компании, иначе говоря, превращение Format в организацию, управляемую данными. Это также означает, что я не могу тратить каждый день на создание собственных инструментов с помощью программного обеспечения Apache. Это приводит меня к моей третьей работе: внедрение правильных инструментов для бизнеса, а не самых крутых и новейших технологий просто ради личного удовольствия.

Вот краткое изложение технологии, которую я использую каждый день:

  • Рубин на рельсах
  • Бессерверная инфраструктура данных
  • Терраформ
  • Амазонка Редшифт
  • Клиенты SQL
  • Инструменты отслеживания пользовательских событий
  • Инструменты для маркетинга и продуктовой аналитики
  • Редактор слов

Я не могу рассказывать обо всех технологиях, которые мы сейчас используем, но вот небольшой абзац:

Бессерверная инфраструктура данных позволяет мне сосредоточиться на данных, а не на производительности, масштабируемости, времени безотказной работы и т.д. Используется клиент SQL, поэтому мы можем погрузиться в необработанные данные, которые мы загружаем в Redshift из наших централизованных инструментов отслеживания пользовательских событий. Но для типичного пользователя у нас есть инструменты для маркетинга и продуктовой аналитики, специально предназначенные для их нужд, например, позволяющие им легко создавать и понимать последовательности конверсии из кампаний или новых применений функций. И, конечно же, текстовый редактор, потому что если вы не будете писать документацию, вы станете документацией. Не создавайте себе узких мест.

Заметили, что в списке нет ни Python, ни K-Means, ни CNN? Нейронные сети и алгоритмы машинного обучения могут творить чудеса для любого бизнеса, но если у вас есть противоречивые данные, товарищи по команде, которые не могут найти нужные им данные, или, что еще хуже, команда, которая не знает, как использовать данные, которые вы им предоставляете, тогда ваши крутые новые передовые алгоритмы ни хрена не делают!

Будущее в Format

Работа с инфраструктурой данных никогда не заканчивается, мне всегда кажется, что я нахожу что-то еще, что можно добавить, удалить или реорганизовать; Однако создание бессерверной инфраструктуры очень помогает. И по мере того, как Format движется к тому, чтобы стать организацией, в большей степени управляемой данными - то есть каждый отдел выполняет свой собственный анализ данных, ежемесячно запускает и анализирует A / B-тесты и т. Д., Это уводит меня от того, чтобы быть узким местом аналитики. Это позволяет мне сосредоточиться на других случайных и интересных долгосрочных проектах, таких как:

  • Создание инструментов анализа данных для наших клиентов, помогающих ей лучше понять, как посетители взаимодействуют с ее портфолио и интернет-магазином.
  • Помощь нашим клиентам в организации изображений портфолио путем их категоризации через CNN (внутренние или другие) для автоматической сортировки, коллекций или рекомендуемых тегов
  • Использование алгоритмов кластеризации для группировки наших клиентов по профессиям (модель, фотограф, иллюстратор и т. Д.), Что позволяет нам более уникально адаптировать их опыт работы

Возможности безграничны.

Конец 2017 года

Когда я начал год, я не застрял, а устал от своего направления карьеры. Я рассматривал инженера по глубокому / машинному обучению как роль в зачаточном состоянии, с большим ростом в будущем. Многие интересные вещи, происходящие в этой области, связаны с исследованиями, а не с практической реализацией и повседневным использованием на предприятиях. И именно здесь я хотел вписаться. Не специалистом по анализу данных, а инженером. Использование, внедрение и поддержка технологии для помощи бизнесу и его пользователям.

В Формате я занимаюсь всем этим и многим другим. Независимое сообщество художников. Независимая компания. Захватывающий и идеальный конец 2017 года.