Публикации по теме 'etl-pipeline'


Конвейер ETL с Pyjanitor
Извлекайте, очищайте и сохраняйте данные с помощью инструментов Python ETL . Обзор Алгоритмам машинного обучения нужны данные хорошего качества для обучения, чтобы они могли делать хорошие прогнозы. Это делается через ETL. Что такое ЭТЛ? ETL (Extract Transform Load) — это основа для создания эффективных алгоритмов машинного обучения. ETL — это трехэтапный анализ данных…

Инжиниринг данных с использованием Джулии Лэнг
Цель этого блога — понять, как построить конвейер обработки данных с помощью Джулии Ланг. В Интернете много блогов, в которых рассказывается о теории DE, и здесь я собираюсь поговорить о CODE, меньше теории, больше кода. Импортировать необходимые библиотеки и наборы данных using CSV using DataFrames using Dates #load the datasets into memory emp_df = CSV.read("D:\\Julia\\emp.csv", DataFrame) print(typeof(emp_df)) #first()to access top 5 records first(emp_df,5)..