Публикации по теме 'dataiku'


Использование машинного обучения для классификации текста
Машинное обучение стало неотъемлемой частью классификации текстов благодаря его мощным возможностям в понимании текста. Классификация текста — это процесс классификации текстовых данных по различным предопределенным классам и их соответствующей маркировки. Алгоритмы машинного обучения используются для автоматической классификации больших объемов немаркированных текстов, что облегчает людям идентификацию одних и тех же классов в похожих…

Обучение моделей машинного обучения с помощью Dataiku и Snowpark ML
Кодовый подход Этот блог был впервые опубликован в блоге Dataiku здесь . В Dataiku мы постоянно думаем о создании производительных, готовых к производству активов и демократизации науки о данных и искусственного интеллекта. Этим интересам хорошо соответствуют два предложения Snowflake: Snowpark Python может повысить производительность — уменьшить перемещение данных и распараллелить вычисления (для определенных API-интерфейсов Snowpark, например, DataFrames). Snowpark ML ,..

Использование XGBoost для прогнозирования сдачи крови без написания кода с помощью Dataiku
Я решил протестировать технологию Data Science Studio с набором данных из конкурса, подобного Kaggle, проводимого организацией под названием Driven Data . Driven Data проводит соревнования по науке о данных для решения проблем, имеющих социальное влияние. Dataiku предоставляет как среду кодирования, так и интерфейс «укажи и щелкни» для очистки данных, обучения моделей и развертывания моделей. Я хотел сравнить ручное кодирование каждого шага в блокноте Jupyter с использованием интерфейса..