Публикации по теме 'scikit-learn'


Классификаторы случайных лесов
Случайный лес — это тип алгоритма машинного обучения с учителем, основанный на обучении ансамбля . Ансамблевое обучение — это тип обучения, при котором вы объединяете различные типы алгоритмов или один и тот же алгоритм несколько раз, чтобы сформировать более мощную модель прогнозирования. Алгоритм случайного леса объединяет несколько алгоритмов одного типа, то есть несколько деревьев решений , в результате чего получается лес деревьев , отсюда и название Случайный лес . Алгоритм..

Библиотеки Python, без которых вы не можете жить
Решил использовать python для своей программы. Изучил базовое программирование на Python. Что теперь? Сообщество Python создало множество библиотек и фреймворков, чтобы мы могли с легкостью осваивать другие области. Вот несколько обязательных библиотек для начала работы. Для научных вычислений, машинного обучения и науки о данных: NumPy http://www.numpy.org Numpy является основой для большинства научных программ. Он предоставляет некоторые расширенные математические..

Визуальная интерпретация структуры дерева решений
В машинном обучении важно понимать, почему на основе конкретных входных данных (гиперпараметры модели, функции или обучающий набор) ваши модели генерируют определенные выходные данные (производительность модели измеряется функциями потерь). Я считаю, что если мы просто отслеживаем производительность модели, у нас не будет полной картины того, что происходит, поэтому мы можем в конечном итоге выбрать набор гиперпараметров, которые, по нашему мнению, позволяют генерировать лучшую модель...

Линейная регрессия
Линейная регрессия Внедрите несколько методов линейной регрессии в набор данных о ценах на жилье в Бостоне с помощью Scikit-learn. импортировать matplotlib.pyplot как plt импортировать numpy как np импортировать pandas url = «https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv ' имена = ['длина чашелистика', 'ширина чашелистика', 'длина лепестка', 'ширина лепестка', 'класс'] набор данных = pandas.read_csv(url, имена = имена) X, Y = набор данных['длина лепестка'],..

Инструменты перекрестной проверки для временных рядов
Инструменты перекрестной проверки для временных рядов Разработка моделей машинного обучения для данных временных рядов требует особого внимания, главным образом потому, что обычное предположение машинного обучения о том, что выборки независимы, обычно не выполняется. В этой публикации я рассмотрю методы перекрестной проверки, подходящие для моделей машинного обучения, работающих с (определенным типом) данных временных рядов, на основе превосходной работы Маркоса Лопеса де Прадо..

Шаблон проекта сквозного машинного обучения - Регрессия - Часть 2
Часть 1 - сформулируйте проблему, показатели эффективности, получение данных, быструю проверку, создание набора тестов и визуальное представление; Часть 2 - конвейер предварительной обработки, моделирование, оценка; Оригинальное репозиторий github находится здесь . 8. Предварительная обработка (подготовить данные для моделирования) Шаги должны охватывать: разделить объекты, метки из набора обучающих данных; очистка данных (нет данных) housing =..

Python - Scikit learn и библиотеки Python
Что такое Scikit learn? Вы когда-нибудь слышали о Numpy, Pandas, Matplotlib, Scipy? Это бесплатные библиотеки машинного обучения для языка программирования Python. Scikit - одна из этих библиотек, которая проста в использовании с несколькими строками кода и может работать с Numpy и Scipy. Разница между этими библиотеками 1. Нумпи Это библиотека для языка программирования Python, добавляющая поддержку больших многомерных массивов и матриц, а также большой набор высокоуровневых..