Как Starburst и trino будут развиваться в будущем, почему нам не нужно больше специалистов по данным, а инженеры данных и Свен в стеке данных показывают, что обсуждают все, что связано с данными.

Данные будут питать каждую часть нашего существования в ближайшем будущем. Я собираю Точки данных, чтобы помочь понять и сформировать это будущее.

Если вы хотите поддержать это, поделитесь им в Twitter, LinkedIn или Facebook.

🔥(1) Джастин Боргман, Starburst в подкасте

Я только что послушал Джастина Боргмана в подкасте opensourceunderdogs, и мне было очень интересно узнать больше о presto/trino, особенно о трех вещах:

  1. Чтобы понять, как они видят себя в контексте сетки данных
  2. Чтобы понять, как они действуют как уровень абстракции/компонент разделения
  3. Общее направление дальнейшего развития.

Мне особенно нравится, как Джастин обсуждает аспект разделения в том смысле, что trino — это своего рода аналитическая база данных без хранилища. Нет необходимости копировать данные, что-то может произойти во время запроса. Конечно, ребятам из firebolt будет что сказать о том, возможно это на самом деле или нет, но мне нравится общее направление.

Мне также нравится этот проект, потому что он дает командам возможность иметь уровень абстракции, который, по сути, позволяет выполнять поэтапную миграцию хранилищ данных или озер данных; Концепция, которую я считаю очень важной. В конце концов, я думаю, вы должны иметь возможность обменивать все основные компоненты своего технического стека каждые 6–12 месяцев.

Ресурсы

🔮(2) Нам нужны инженеры данных, а не ученые!

Михаил Эрик, исследователь машинного обучения, немного покопался в данных, стоящих за текущими вакансиями «данных», и получил довольно ошеломляющие цифры: на 70% больше вакансий в области «инженерии данных» по сравнению с областью «ученый данных».

Да, это оно! Все, чем я хотел поделиться, на этот раз только число. Просто позвольте этому погрузиться.

Ресурсы

🔮🔮🔮 Уголок компании данных 🔮🔮🔮

Вещи, которые могут быть интересны всем, кто находится на переднем крае мира данных, внутри компании, занимающейся данными, вдохновленной большим количеством положительных отзывов из моей статьи о коммерческих компаниях данных программного обеспечения с открытым исходным кодом.

📣 (3) От Свена: четыре дракона данных — подкаст

Я действительно весело провел время, обсуждая множество различных тем в пространстве данных и объясняя некоторые идеи о четырех драконах данных на шоу стека данных, которое представлено RudderStack. Четыре дракона — это DAKS:

- Dдецентрализация данных

- Много данных

- Квидов структур данных

- Проблема данных Snowflake

Если вы хотите проверить это, перейдите сюда:

🎄 Другие новости и благодарности

Спасибо, что дочитали до этого места! Я также был бы рад, если бы вы поделились этим информационным бюллетенем с людьми, которым, по вашему мнению, он может быть интересен.

P.S. Я делюсь важными, а не самыми последними новостями. Я делюсь книгами, исследовательскими работами и инструментами. Я пытаюсь дать простой способ понять все эти вещи. Я склонен быть самоуверенным. Вы всегда можете нажать кнопку отказа от подписки!