Публикации по теме 'dataiku'
Использование машинного обучения для классификации текста
Машинное обучение стало неотъемлемой частью классификации текстов благодаря его мощным возможностям в понимании текста. Классификация текста — это процесс классификации текстовых данных по различным предопределенным классам и их соответствующей маркировки. Алгоритмы машинного обучения используются для автоматической классификации больших объемов немаркированных текстов, что облегчает людям идентификацию одних и тех же классов в похожих…
Обучение моделей машинного обучения с помощью Dataiku и Snowpark ML
Кодовый подход
Этот блог был впервые опубликован в блоге Dataiku здесь .
В Dataiku мы постоянно думаем о создании производительных, готовых к производству активов и демократизации науки о данных и искусственного интеллекта.
Этим интересам хорошо соответствуют два предложения Snowflake:
Snowpark Python может повысить производительность — уменьшить перемещение данных и распараллелить вычисления (для определенных API-интерфейсов Snowpark, например, DataFrames). Snowpark ML ,..
Использование XGBoost для прогнозирования сдачи крови без написания кода с помощью Dataiku
Я решил протестировать технологию Data Science Studio с набором данных из конкурса, подобного Kaggle, проводимого организацией под названием Driven Data . Driven Data проводит соревнования по науке о данных для решения проблем, имеющих социальное влияние.
Dataiku предоставляет как среду кодирования, так и интерфейс «укажи и щелкни» для очистки данных, обучения моделей и развертывания моделей.
Я хотел сравнить ручное кодирование каждого шага в блокноте Jupyter с использованием интерфейса..