Публикации по теме 'etl-pipeline'
Конвейер ETL с Pyjanitor
Извлекайте, очищайте и сохраняйте данные с помощью инструментов Python ETL .
Обзор
Алгоритмам машинного обучения нужны данные хорошего качества для обучения, чтобы они могли делать хорошие прогнозы. Это делается через ETL.
Что такое ЭТЛ?
ETL (Extract Transform Load) — это основа для создания эффективных алгоритмов машинного обучения. ETL — это трехэтапный анализ данных…
Инжиниринг данных с использованием Джулии Лэнг
Цель этого блога — понять, как построить конвейер обработки данных с помощью Джулии Ланг. В Интернете много блогов, в которых рассказывается о теории DE, и здесь я собираюсь поговорить о CODE, меньше теории, больше кода.
Импортировать необходимые библиотеки и наборы данных
using CSV
using DataFrames
using Dates
#load the datasets into memory
emp_df = CSV.read("D:\\Julia\\emp.csv", DataFrame)
print(typeof(emp_df))
#first()to access top 5 records
first(emp_df,5)..