Публикации по теме 'scikit-learn'


Найдите свои гиперпараметры для конвейеров scikit-learn с помощью Microsoft NNI
Что такое поиск по гиперпараметрам? Цель любого алгоритма машинного обучения - найти закономерности в выборочных данных, а затем использовать эти шаблоны для прогнозирования результатов на основе невидимых выборочных (тестовых) данных. Паттерны, которые изучает алгоритм машинного обучения, закодированы в весах (также называемых параметрами) модели. Однако алгоритм машинного обучения может применяться к разным типам данных, и даже для сценариев, в которых «тип» данных один и тот же,..

Пробуем разные архитектуры модели на Titanic Dataset
В этой записной книжке мы рассмотрим предварительные процессы создания высокопроизводительной модели, чтобы предсказать, выжил ли пассажир на Титанике, на основе личной информации, такой как цена билета, возраст и пол. В этом блокноте показано, как: Выполнение исследовательского анализа данных Попробуйте следующие различные архитектуры моделей и интерпретируйте их производительность: - Наивный байесовский метод - Сеть прямого распространения - Дерево решений - Ближайшие соседи Мы..

3 метода обработки отсутствующих данных с помощью Python
Руководство по работе с отсутствующими данными с помощью библиотек Scikit-Learn и Pandas. Фреймворки машинного обучения не работают с отсутствующими данными. Перед построением модели машинного обучения необходимо решить, как обрабатывать отсутствующие данные. Вы можете использовать различные методы для отсутствующих данных. Например, вы можете удалить все строки с отсутствующими данными. Но этот метод приводит к потере информации. Заполнение недостающих данных статистическими..

Раскрытие возможностей активного обучения с modAL: руководство для начинающих
Активное обучение  – это эффективный подход к повышению производительности моделей машинного обучения путем выборочной маркировки наиболее информативных образцов. В этом уроке мы покажем вам, как использовать библиотеку modAL в Python для реализации активного обучения. modAL  – это библиотека активного обучения с открытым исходным кодом для Python, предназначенная для активного обучения…

Анализ главных компонентов (PCA) с помощью Scikit-learn
Алгоритм неконтролируемого машинного обучения для уменьшения размерности Всем привет! Это второй алгоритм машинного обучения без учителя, который я обсуждаю здесь. На этот раз тема - Анализ главных компонентов (PCA). В самом начале руководства я объясню размерность набора данных, что означает уменьшение размерности, основные подходы к уменьшению размерности, причины уменьшения размерности и что означает PCA. Затем я углублюсь в тему PCA, реализовав алгоритм PCA с библиотекой..

Познакомьтесь с HistGradientBoostingClassifier
питон Познакомьтесь с HistGradientBoostingClassifier Более гибкий и масштабируемый GradientBoostingClassifier GradientBoostingClassifier от Scikit-learn (далее GBM) — один из самых популярных ансамблевых алгоритмов, который хорошо работает со многими наборами данных. HistGradientBoostingClassifier (далее HGBM), основанная на гистограмме альтернативная реализация GBM, была представлена ​​в v0.21.0 в качестве экспериментальной оценки. Начиная с v1.0.0 , этот оценщик стал..

Полное руководство по изучению методов предварительной обработки scikit: Часть 1
Предварительная обработка данных является одним из важнейших этапов конвейера в машинном обучении. Он служит нескольким целям, таким как масштабирование (и стандартизация), нормализация, импутация и маркировка входящих векторов признаков. Модуль предварительной обработки Scikit Learn помогает преобразовывать необработанные данные в подходящее представление перед их вводом в алгоритмы. В этом модуле присутствует несколько служебных функций, использование которых в основном зависит от..