Публикации по теме 'scikit-learn'


Как обрабатывать отсутствующие значения с помощью Python?
После того, как мы закончили веб-парсинг (процесс извлечения данных из источника), у нас есть данные, но в неструктурированной или необработанной форме (или в неочищенной форме). Что нам нужно сделать сейчас, так это очистить наши данные, чтобы мы могли исследовать дальше. Согласно IBM Data Analytics , вы можете потратить до 80% своего времени на очистку данных . Причина этого трудоемкого процесса заключается в том, что данные в необработанной форме могут иметь некоторые..

Обучение модели с использованием платформы Google Cloud AI - настройка гиперпараметров
В предыдущих статьях мы видели, как использовать Google Cloud AI Platform для обучения модели. Использование предварительно созданной среды выполнения Google Использование пользовательских контейнеров В этой статье мы рассмотрим, как использовать Google Cloud AI Platform для выполнения настройки гиперпараметров. Прежде чем мы рассмотрим пример настройки гиперпараметров, давайте разберемся с ее основами. Гиперпараметры содержат данные, которые регулируют сам процесс..

Контролируемое машинное обучение на примере Python
Машинное обучение становится все более важной областью, которая коренным образом меняет наш подход к анализу данных и моделированию. В этом сообщении блога мы рассмотрим различные методы машинного обучения с учителем и то, как их можно реализовать с помощью Python и библиотеки scikit-learn (также известной как sklearn). Обучение с учителем — это тип машинного обучения, при котором алгоритм обучается на размеченных данных. Помеченные данные относятся к данным, которые имеют известный..

Обычное руководство по контролируемому обучению с помощью scikit-learn — Многозадачное лассо — обобщенное линейное…
Обычное руководство по контролируемому обучению с помощью scikit-learn — Многозадачные обобщенные линейные модели Lasso (5) Это пятая часть из серии из 92 частей традиционного руководства по обучению с учителем с помощью scikit-learn, написанного с целью овладеть навыками реализации алгоритмов для продуктивного использования и объяснить алгоритмическую логику, лежащую в их основе. Ссылки на все части смотрите в первой статье . Это продолжение обсуждения регрессии лассо ,..

Прогноз цены на бриллианты
Прогнозирование цены бриллианта с помощью scikit-learn на основе данных, доступных на Kaggle . Бриллианты всегда высоко ценились и пользовались спросом у членов королевской семьи и простых людей. От украшения корон и тиар до применения в промышленности бриллианты являются универсальными объектами. Так как же оценивается такой универсальный товар? Цена бриллианта в основном сводится к нескольким характеристикам: карат, огранка, цвет, чистота, глубина и таблица. Все эти факторы в..

Машинное обучение для распознавания рукописных цифр
Машинное обучение  – это область искусственного интеллекта , в которой система предназначена для автоматического обучения на основе набора входных данных. После того, как система научилась (мы говорим, что система была обучена), мы можем использовать ее для прогнозирования новых данных, невиданных ранее. Такой подход позволяет решать сложные задачи, которые сложно или невозможно решить с помощью традиционного последовательного программирования. Распознавание рукописного текста —..

Обучение Scikit: Сообщение 1: Вменение пропущенных значений
Мы все знаем, что предварительная обработка данных — это очень трудоемкая задача в рамках роли специалиста по обработке и анализу данных. Данные не совсем чистые, как мы видим из примеров наборов данных в Kaggle, kdnuggets, data.gov или любых репозиториях машинного обучения. Когда мы используем такие инструменты, как SAS, корпоративный майнер SAS, Weka или даже инструменты визуализации, такие как tableau и powerBI, мы многое упускаем из того, что происходит на задворках истории...