Публикации по теме 'scikit-learn'


Развертывание модели Scikit-Learn на AWS с использованием оценщиков SKLearn, локальных блокнотов Jupyter и…
Пошаговое руководство по развертыванию модели scikit-learn на AWS с локального устройства. Amazon Web Services (AWS) в настоящее время является самой востребованной облачной платформой для профессионалов в области науки о данных и машинного обучения. Исходя из этого, в первом сборнике сообщений в блогах этой серии статей о развертывании машинного обучения будет рассказано, как развертывать различные модели различными способами на AWS. Другие публикации из этой серии: Введение..

Бэггинг: секретное оружие в вашем арсенале машинного обучения
Методы ансамблевого обучения набирают популярность в области машинного обучения. Одним из наиболее широко используемых методов ансамблевого обучения является бэггинг. Это метод, который включает создание нескольких версий обучающего набора данных путем начальной загрузки, а затем использование этих наборов данных для обучения отдельного экземпляра базового алгоритма обучения. Затем прогнозы каждой из этих отдельных моделей каким-либо образом объединяются, например, путем усреднения или..

Обучение науке о данных: день 19 - Наивный Байес
В последних двух статьях мы говорили о теореме Байеса и ее применении. Сегодня мы узнаем больше о наивном байесовском классификаторе. Предыдущее, апостериорное, правдоподобие и доказательства Чтобы узнать больше о Байесе, я думаю, будет лучше, если мы поймем правило Байеса более техническим способом. Так что у нас не было никаких проблем, когда мы попытались узнать больше. Мы знали правило Байеса, не понимая роли каждой переменной. Упрощенное правило Байеса цитируется ниже...

Соревнование НЛП между классификаторами машин Varios!
Логистический, регуляризованный линейный, SVM, ANN, KNN, случайный лес, LGBM и наивный байесовский классификатор, какой из них лучше всего справляется с классификацией газетных статей? Все эти классификаторы машинного обучения в scikit-learn и light GBM могут эффективно обрабатывать матрицу scipy.sparse, которая является выходом TfidfVectorizer . TfidfVectorizer — это экстрактор функций НЛП, который использует стратегии мешка слов . Сначала он применяет CountVectorizer , а затем..

Понимание SVR и нечувствительной потери Epsilon с помощью Scikit-learn
С визуализацией для четкого объяснения влияния гиперпараметров SVR или регрессия опорных векторов — это модель для задач регрессии. Для тех, кто хочет понять, чем это интересно, или думает, что уже знает, как работает модель, вот несколько простых вопросов: Рассмотрим следующий простой набор данных только с одним признаком и некоторыми выбросами. На каждом рисунке один гиперпараметр меняет свое значение, и, таким образом, мы можем визуально интерпретировать, как это влияет на модель...

Разреженная матрица
Разреженная матрица Сценарий использования разреженной матрицы вместо плотной Если вы помните, в предыдущей статье я использовал .toarray() для преобразования вывода кодировщика onehot. Почему я это сделал? Давайте посмотрим, как будет выглядеть вывод, если бы я этого не сделал. import pickle import pandas as pd from sklearn.preprocessing import OneHotEncoder with open("data/sp500info_df.pickle", "rb") as f: stocks_df = pickle.load(f).\..

scikit узнать шпаргалку по Sklearn
Sklearn может быть первой платформой машинного обучения, которую вы изучили. Исследователям нравится его API за простоту использования и идеальную гибкость при создании прототипов. Сегодня специалисты по машинному обучению, исследователи данных Kaggle и участники хакатона используют библиотеку в сочетании с такими средами глубокого обучения, как Pytorch и Tensorflow, для разделения данных, предварительной обработки и обработки отсутствующих значений и значений NaN. Шаблон кода API Sklearn..