Публикации по теме 'airflow'


Интеграция PrimeHub и Apache Airflow
Автор Эш Ву и Эвен Вэй В области машинного обучения существует множество инструментов. Очень часто можно использовать PrimeHub вместе с другими инструментами — независимо от того, что PrimeHub не охватил или это незаменимая часть вашего существующего рабочего процесса. Мы хотим, чтобы PrimeHub хорошо сочетался с другими инструментами в этой области, пока мы создаем PrimeHub. Есть два подхода: фаппликации позволяют нам интегрировать другие инструменты в PrimeHub. А с помощью..

Запуск конвейеров машинного обучения с помощью Kedro, Kubeflow и Airflow
Одной из самых больших проблем современного мира машинного обучения является отсутствие стандартизации, когда речь идет об обучении моделей. Все мы знаем, что данные необходимо очищать, разделять на обучающие и тестовые наборы, помещать в модель и проверять на основе наблюдений из тестового подмножества. Возможно, должна быть задействована перекрестная проверка, настройка гиперпараметров тоже неплохая идея. Все специалисты по данным знают, как эффективно работать с моделями, но..

Поток воздуха
В FLYR мы используем Apache Airflow для многих наших запланированных заданий по приему данных. Airflow - это планировщик и монитор с графическим интерфейсом, который отображает рабочие процессы в виде направленных ациклических графиков (DAG). Методом проб и ошибок мы узнали, что Airflow хорош в некоторых ситуациях, но имеет конкретные ограничения, которые делают его неэффективным для определенных приложений. В этой статье мы обсудим преимущества использования Airflow, решения..

Как запустить Airflow локально с помощью Docker
Пошаговое руководство по запуску Airflow с Docker на локальном компьютере Введение Apache Airflow — одна из самых популярных технологий в области проектирования данных, которая позволяет пользователям создавать, организовывать и отслеживать конвейеры данных в любом масштабе. Есть определенный шанс, что вы уже пытались запустить Airflow локально, установив его через pip , но есть вероятность, что вы столкнетесь с проблемами и, что еще хуже, испортите свою локальную среду. Если вы..

Prefect vs Airflow: Битва инструментов управления рабочим процессом
Конвейер машинного обучения (ML) может стать перегруженным по мере продвижения проекта, поскольку со временем добавляется несколько слоев. Чтобы упростить процесс для разработчиков, инструменты мониторинга и управления рабочими процессами используются для представления сквозного потока данных. Некоторые функции инструментов управления рабочими процессами включают MLOps, автоматизацию конвейера, пакетную обработку и многое другое. Два самых популярных инструмента управления рабочим..

Интеграция Airflow и MLFlow
Поток воздуха Airflow - это платформа для программного создания, планирования и мониторинга рабочих процессов. Используйте Airflow для создания рабочих процессов в виде направленных ациклических графиков (DAG) задач. Основные 4 компонента Airflow - это веб-сервер, планировщик, исполнитель и база данных метаданных. Подробности об этих 4 компонентах можно найти здесь . Дело в том, что если мы начнем подробно обсуждать Airflow, для завершения обсуждения потребуется много времени...

Надежные трубопроводы машинного обучения с часовым механизмом
Как мы управляем планированием и автоматизацией конвейеров машинного обучения в Kubernetes. В следующей серии статей Платформа машинного обучения компании Gojek мы рассмотрим планирование и автоматизацию конвейеров данных и обучение моделей. Одна «несексуальная» сторона науки о данных - это количество повторяющейся работы. Новые данные необходимо принимать и преобразовывать в полезные функции. Моделей нужно переучивать. Метрики необходимо вычислять и сообщать. Обычно это..