Публикации по теме 'data-engineering'


📢 Предстоящие вебинары по науке о данных
Зарегестрируйтесь сейчас бесплатно!! Введение Добро пожаловать в мир сессий DataHour, серию информативных и интерактивных вебинаров, предназначенных для расширения возможностей людей, желающих построить карьеру в индустрии информационных технологий. Кто может посещать эти сеансы DataHour? Стремящиеся люди, которые хотят начать карьеру в индустрии информационных технологий, в том числе студенты и первокурсники. Текущие специалисты, стремящиеся перейти в область технологий..

Исследование сегментации клиентов для Arvato Financial Services
Отчет для проекта Udacity Data Scientist Capstone: создание отчета по сегментации клиентов для Arvato Financial Services. Часть 1 Предпосылки и введение Цель этого проекта - предсказать, какие люди с наибольшей вероятностью станут клиентами компании по продаже почтовых услуг в Германии. Этот проект представляет собой реальную задачу по науке о данных, предоставленную партнерами Bertelsmann Arvato Analytics, и он также служит в качестве проекта Capstone для нано-степени Udacity..

Лучшие отраслевые практики для специалистов по данным
Лучшие отраслевые практики для специалистов по данным Вот лучшие отраслевые практики для специалистов по обработке данных, которые я наблюдал. Не стесняйтесь добавлять больше в комментариях. Некоторые из них можно исключить из числа инженеров по обработке данных, если они есть в вашей команде. **Определение проблемы** Четко определите проблему, которую вы пытаетесь решить, и цели, которых стремитесь достичь. 2. **Сбор данных** . Соберите релевантные высококачественные данные,..

Анализ ежемесячных розничных цен на продукты питания в Индии
Введение: Используя исторические данные, можно принимать более разумные решения о покупке, чтобы определить лучшее время и регионы для покупки определенных товаров. Эти знания не только помогают потребителям или торговцам экономить деньги, но и способствуют пониманию динамики на розничном рынке продуктов питания. В этой статье мы рассмотрим ежемесячный набор данных о розничных ценах на продукты питания, чтобы проанализировать колебания цен в разных штатах Индии и получить..

Наши выводы и сессии для повторного просмотра с Beam Summit 2022
На прошлой неделе на youtube-канал Apache Beam были загружены все записанные сессии с саммита Beam, состоявшегося в июле 2022 года, на котором наш инженер машинного обучения Константин также выступил с докладом. Там много интересного, может быть, даже слишком много! Итак, мы постараемся облегчить вашу жизнь, поделившись нашими общими мыслями и выводами о саммите, а также почему мы взволнованы будущим Beam. Кроме того, мы поделимся некоторыми интересными сессиями, которые, по нашему мнению,..

Повышение синтетических данных в аналитике данных
В соавторстве с Gabriel Machado Начнем с жизненного цикла стартапа, управляемого данными. Продукт создан Пакетная обработка настроена на получение MoM (Месяц за месяцем) , YoY (Год за годом) , DoD (День за днем) ) и другие данные для инициализации роста. Постепенно мы видим потребность в получении определенной информации почти в режиме реального времени (NRT). Мы настроили некоторые потоковые задания. К настоящему времени мы собрали достаточно данных для начала прогнозного..

Обновление продукта Segna — Августовское издание
Мы вернулись с рассылкой обновлений продуктов Segna по электронной почте, в которой мы делимся несколькими захватывающими обновлениями продуктов за последние пару недель! Мы надеемся, что вам понравятся эти обновления так же сильно, как и нам. Как всегда, пожалуйста, свяжитесь с нашей командой, если мы можем чем-то помочь 😊 📃Документы Документы Документы Мы перевели все наши спецификации API в стандарт OpenAPI — это не только отлично подходит для наших внутренних процессов, но..