Публикации по теме 'sklearn'


Изучение роли базовых оценок в алгоритмах машинного обучения
sklearn.base.BaseEstimator sklearn.base.BaseEstimator — это базовый класс в библиотеке машинного обучения scikit-learn, определяющий базовый интерфейс для всех средств оценки в scikit-learn. Он предоставляет набор методов и атрибутов, которые любой пользовательский оценщик должен реализовать или унаследовать для правильной работы с каркасом scikit-learn. В этом объяснении мы подробно рассмотрим различные методы и атрибуты BaseEstimator . Оценщики В машинном обучении оценщик —..

Как работать с отсутствующими значениями?
Практическое руководство по Kickstarter. В предыдущих статьях я обещал обсудить, как исправить недостающие значения! В этой статье мы рассмотрим различные стратегии противодействия пропущенным значениям. Вы научитесь сравнивать эффективность этих подходов на любом заданном или большей части набора данных. Вступление Согласно Википедии, «В статистике отсутствующие данные или отсутствующие значения возникают, когда для переменной в наблюдении не сохраняется значение данных...

Работает ли TF-IDF по-разному в учебниках и рутине склерна?
TF-IDF - это простой поворот в пакете слов. Пакет слов просто означает ( # раз слово w встречается в документе d ). TF-IDF означает термин "частота, умноженная на обратную частоту документа". На изображении ниже рассказывается о подходе с использованием набора слов для численного кодирования текстовых данных для работы с текстовыми данными в условиях машинного обучения. В приведенном ниже примере слово «щенок» встречается в тексте ровно один раз, поэтому в пакете слов vector puppy..

Вопрос интервью: что такое линейная регрессия?
Линейный регрессионный анализ используется для прогнозирования значения непрерывной переменной переменной на основе значения другой переменной. Прогнозируемая переменная является зависимой переменной или выходом. Переменная, которая используется для прогнозирования, является независимой переменной или входом. Линейная регрессия соответствует прямой линии или поверхности, которая минимизирует расхождения между…

scikit-learn Разница между fit_transform и transform
fit_transform и transform — это два метода, используемые в машинном обучении для предварительной обработки данных. fit_transform представляет собой комбинацию двух операций: fit : вычисляет параметры, необходимые для преобразования данных. Например, он может найти среднее значение и стандартное отклонение данных, чтобы нормализовать их. transform : Применяет преобразование к данным с использованием параметров, рассчитанных на шаге fit . transform используется, когда вы..

Sklearn from Beggining (Часть 2) Разделение набора данных на обучающий и тестовый наборы данных для оценки нашего…
импортировать sklearn из sklearn.datasets import load_iris iris=load_iris() x=iris.data y=iris.target from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=.3,random_state=1) print(x_train.shape) print(y_train.shape) print(x_test .shape) print(y_test.shape) выход-(105, 4)(105,)(45, 4)(45,) (Здесь мы взяли, что test_size равен 0,3. Это означает, что мы взяли 30% данных из набора данных для тестирования, а оставшиеся 70%..

Шаги установки PyCaret, которые вам нужно знать
PyCaret — это библиотека машинного обучения с открытым исходным кодом на Python, которая автоматизирует рабочие процессы машинного обучения. Я изо всех сил пытался установить PyCaret из-за разных версий Python и sklearn, но после нескольких попыток я успешно установил PyCaret в Windows, Debian и Google Colab. Установка в Windows и Debian PyCaret не пока совместим с sklearn›0.23.2 , но работает с Python 3.8 и sklearn 0.23.2 как в Windows, так и в Linux. Сначала создайте..