С Вероникой Чжай из Fivetran

Масштабировать талант к работе с данными сложно.

Трудно нанять.

Трудно расти и в целом сложно с точки зрения управления процессами и результатами.

Но есть блестящие лидеры и менеджеры, которые делают это каждый день.

Недавно я взял интервью у Вероники Чжай, главного менеджера по продукту Fivetran. Она возглавляла аналитическую группу Fivetran почти последний год, и ей удалось расширить ее, составить определенную дорожную карту и достичь поставленных целей.

В этом обновлении сообщества я хотел свести интервью к ключевым моментам, таким как наем специалистов по работе с данными, решение проблемных точек потока данных и обсуждение современного стека данных.

Давайте нырнем!

Знакомство с Вероникой и ее прошлым

Вероника окончила Колумбийский университет в 2015 году, прежде чем стать трейдером деривативов в J.P. Morgan. Там она возглавила преобразование данных с помощью анализа данных и искусственного интеллекта. машинное обучение при увеличении прибыли более чем на 152% г / г.

Добившись огромного успеха на финансовых рынках, Вероника перешла в компанию Fivetran, которая использует аналитику данных, чтобы помочь предприятиям масштабировать свои операции.

Вероника в настоящее время является главным менеджером по продукту в команде аналитиков Fivetran. Она отвечает за общую дорожную карту и выполнение их аналитической платформы, которая обрабатывает миллионы транзакций в день. Вероника помогла увеличить штат сотрудников с менее чем десяти человек до почти 20 - и она знает, что со временем масштабирование станет еще одной вещью в ее арсенале.

Как вы можете управлять информационным продуктом?

Я начал свою карьеру трейдером опционов. Как трейдер, я был очень впечатлен количественными характеристиками этих систем. Мы смогли использовать систему, которая позволяла нам, трейдерам, зарабатывать более 100 миллионов долларов в год.

Однако я заметил, что не уделялось большого внимания сбору и оптимизации рыночных данных. Итак, я взялся за проект, который позволил бы нам лучше торговать и монетизировать информацию, полученную на основе данных.

Так зародилась моя страсть к пониманию аналитики и использованию рыночных данных для увеличения доходов бизнеса. Оттуда я создал первый аналитический стек для J.P. Morgan, где мы централизовали все данные в одном месте для более эффективного извлечения данных.

С какими основными проблемами вы столкнулись при разработке этого проекта данных?

Я заметил, что у разных компаний разные болевые точки.

Давайте сначала посмотрим на более крупные предприятия. У такой компании, как J.P. Morgan, есть очень зрелые и чистые данные. Проблема для крупного предприятия будет заключаться не в очистке или организации данных, а во внедрении современного стека данных.

Многие из этих старых предприятий используют старую инфраструктуру, которая может быть ограничена при попытке масштабирования с большими объемами данных.

Второй проблемой, которую я увидел в J.P. Morgan, было время, которое потребовалось инженерам по обработке данных, чтобы собрать необходимые данные для меня, чтобы завершить мой проект.

В этом случае потребовалось шесть месяцев, чтобы инженеры по обработке данных выполнили свои задачи и работу.

Если смотреть на более мелкие предприятия, они, как правило, более гибкие и лучше адаптируются к техническим системам, но проблема часто заключается в операционных системах.

Когда компания меньше и быстро масштабируется, системные и операционные проблемы возникают очень часто.

Подводя итог, можно сказать, что одной из наиболее распространенных проблемных точек для крупных предприятий является инфраструктура, в то время как малые предприятия часто более гибки и с большей вероятностью столкнутся с проблемами при работе.

В какой момент вы подумали, что у Фивитрана правильная идея?

Как человек, ответственный за предоставление информации о бизнесе, я был лично разочарован тем, что не мог сделать это быстрее.

Это побудило меня начать исследование различных технологий, которые могут позволить нам заниматься инженерией данных и быстрее строить конвейеры данных.

Именно тогда я наткнулся на Fivetran.

Fivetran может перемещать данные из источников в пункты назначения за считанные дни, а не недели и месяцы.

Перенос данных со скоростью, позволяющей сэкономить месяцы ожидания, был именно тем решением, которое я искал. Чем больше я узнавал о Fivetran, тем больше я влюблялся в компанию и то, что они олицетворяют.

Что для вас значит современный стек данных?

Я думаю о современном стеке данных как о наборе облачных инструментов обработки данных, предназначенных для автоматизации, обеспечения простоты использования и предоставления недорогого решения, помогающего компаниям лучше управлять данными.

Как вы думаете, в каком состоянии сейчас находятся стеки данных большинства компаний?

Самое интересное в современной индустрии стеков данных - это возможность интегрировать различные новые технологии.

Например, есть облачные хранилища данных вроде Snowflake и Bigquery, а также B.I. такие инструменты, как Tableau, и инструменты преобразования данных, такие как dbt, которые могут интегрироваться и работать вместе.

Теперь компании должны использовать это программное обеспечение, которое работает вместе, чтобы полностью понимать объем имеющихся данных.

Генеральный директор Accenture упомянул, что 90% данных были собраны за последние два года, и только 1 процент этих данных был фактически использован.

Это свидетельствует о необходимости централизованных систем и программного обеспечения, которые хорошо интегрируются друг с другом.

Нанять профессионалов в области данных сложно. Будь то специалисты по данным, аналитики или инженеры по обработке данных. Что вы вообще ищете от специалиста по обработке данных?

Я думаю об этом как о мягких навыках и технических навыках.

В каждом из этих навыков есть два ключевых столпа.

Технические навыки. Первый столп технических навыков - умеешь ли ты писать код? Вы действительно хорошо умеете SQL? Можете ли вы использовать визуализацию и Б.И. инструменты?

Второй столп - знание предметной области.

Чтобы добиться успеха в качестве аналитика данных, вам необходимо обладать достаточной деловой интуицией, чтобы решать проблему, просматривая данные. Наличие опыта маркетинговой аналитики или другого опыта, связанного с бизнесом, имеет большое значение. Решение проблем необходимо, если вы хотите добиться успеха в этой области.

Мягкие навыки: Что касается мягких навыков, я действительно ценю «искру». Насколько вы взволнованы, когда можете собирать данные и находить решения для бизнеса?

На мой взгляд, это то, что отличает опытного аналитика данных от исключительного.

Второй аспект - это ваша способность общаться. Взаимодействие с заинтересованными сторонами и конечными пользователями и адекватный обмен результатами исследования данных является важным элементом работы в индустрии данных.

Являются ли их архетипы специалистами по данным?

Я думаю, что традиционный подход к управлению и масштабированию команды заключается в рассмотрении различных архетипов роли.

Однако я думаю об этом больше с точки зрения навыков.

Какие навыки нам нужны внутри команды? И какие навыки мы можем получить, используя различное программное обеспечение, доступное нам?

1. Навыки SQL

Навык номер 1, который я ищу в команде данных, - это SQL.

Чтобы добиться хороших результатов в SQL, нужно от шести месяцев до года, поэтому мы очень ценим это в наших командах.

2. Аналитика

Второй по важности навык - аналитика.

Может ли человек критически относиться к проблеме и решать ее аналитически?

3. Инфраструктура

Третий навык, который я бы сказал, - это способность построить реальную инфраструктуру. Это скорее роль инженера данных.

Однако, используя программное обеспечение, вы часто можете заменить роль инженера по данным.

4. Навыки PM

Поскольку вы поставляете продукты для внутренних или внешних конечных пользователей, вам нужен кто-то, кто может собирать требования, определять приоритеты, общаться с заинтересованными сторонами и управлять проектом.

5. Навыки прогнозирования

Аналитики больше стремятся решить, что произошло в прошлом, но вам также нужны специалисты по данным, которые могут смотреть на те же данные и предсказывать, что произойдет в будущем, для более эффективного управления вашим бизнесом.

С какими проблемами вы столкнулись при расширении группы данных?

Смысл масштабирования команды заключается в создании команды, способной идти в ногу с ростом организации.

Одна из наиболее важных проблем, которые мы обнаружили, заключалась в том, что мы начали проектирование организации с распределенной модели.

Мы поняли, что распределенная модель не очень эффективна при быстром масштабировании организации. Причина этого в том, что наличие нецентрализованной системы приведет к несогласованности с точки зрения стратегии и исполнения.

Вся суть построения стека данных состоит в том, чтобы централизовать все данные в одном месте, поэтому, если у вас также нет централизованной команды, это лишает смысла создание централизованного стека данных.

Какова ваша организационная структура для разработки дорожной карты данных для вашей команды?

По мере роста команды, если бы у нас были тысячи сотрудников, я вижу, что мы переходим на централизованную децентрализованную модель, такую ​​как Facebook.

В какой-то момент, когда в организации будет достаточно сотрудников, придется рассмотреть новую модель. Однако наличие ключевой части организации в виде централизованной структуры и команды всегда будет очень важно.

Наконец-то! Почему генеральным директорам следует инвестировать в данные?

Данные - неотъемлемая часть современного мира. Если компании не инвестируют в данные, им грозит исчезновение бизнеса.

Конкуренты используют эти модели данных и оптимизируют методы работы своего бизнеса.

Если все другие компании делают это, а вы нет, я не думаю, что компания сможет выжить в этом мире, ориентированном на данные.

Закрытие

После этого вопроса мы с Вероникой продолжили разговор, так как люди задавали вопросы в прямом эфире.

В целом, я хочу поблагодарить Veronica M. Zhai за уделенное ей время! Я многому научился, разговаривая с ней, и надеюсь, что вы тоже.

Прочтите эти далее

✉️ Подпишитесь на мой список рассылки для получения обновлений и бесплатных услуг сообщества

Обо мне

Я провел свою карьеру, сосредоточившись на всех формах данных. Я сосредоточился на разработке алгоритмов для выявления мошенничества, сокращения повторной госпитализации пациентов и изменения политики страховой компании, чтобы помочь снизить общие затраты на здравоохранение. Я также помогал разрабатывать аналитику для маркетинга и ИТ-операций, чтобы оптимизировать ограниченные ресурсы, такие как сотрудники и бюджет. Я лично консультирую по вопросам науки о данных и инженерных проблем как в одиночку, так и в компании Acheron Analytics. У меня есть опыт как практической работы с техническими проблемами, так и помощи руководящим группам в разработке стратегий для максимизации их данных.



Свяжитесь со мной в социальной сети

✅ YouTube: https://www.youtube.com/channel/SeattleDataGuy
✅ Веб-сайт: https://www.theseattledataguy.com/
✅ LinkedIn: https: // www .linkedin.com / company / 18129251
✅ Личный Linkedin: https://www.linkedin.com/in/benjaminrogojan/
✅ FaceBook: https://www.facebook.com / SeattleDataGu y