Публикации по теме 'scikit-learn'


1. Введение
2. Машина повышения градиента света Точный и систематический мониторинг пахотных земель в региональном и глобальном масштабе имеет решающее значение для многих сельскохозяйственных приложений, начиная от мониторинга урожайности сельскохозяйственных культур и оценки биомассы до управления сельскохозяйственными субсидиями. Из-за динамической структуры посевов необходимо своевременное обновление карт посевов для прогнозирования урожайности и планирования сельскохозяйственной политики [ 1 ,..

Масштабирование функций с помощью Scikit-Learn для науки о данных
В процессе обработки данных нам необходимо выполнить некоторую предварительную обработку перед алгоритмами машинного обучения. Это могут быть некоторые базовые процессы анализа данных, такие как обработка пропущенных значений и выбросов, а также очистка данных. Мы также применяем масштабирование (преобразование данных) для некоторых данных. Масштабирование не является обязательным, но оно лучше масштабирует данные перед некоторыми алгоритмами машинного обучения. Основная цель..

07 — Hands On ML — Ансамбль
Ensemble Learning принимает прогнозы нескольких моделей и предполагает, что результат будет иметь наибольшее количество голосов. Когда вы обучаете несколько деревьев решений, каждое из которых основано на некоторой случайной выборке набора данных, и для прогнозов вы берете прогнозы всех деревьев, выходным классом будет класс, получивший наибольшее количество голосов. Этот подход называется случайным лесом. Классификатор голосования - это когда вы обучаете данные на нескольких..

Распознавание рукописных цифр
Распознавание рукописного текста — это проблема, которая восходит к первым автоматическим машинам, которым нужно было распознавать отдельные символы в рукописных документах. Классификация рукописного текста или чисел важна для многих реальных сценариев. Например, почтовая служба может сканировать почтовые индексы на конвертах, чтобы автоматизировать группировку конвертов, которые должны быть отправлены в одно и то же место. В этой статье мы будем использовать набор данных Digit из..

Статистика НБА и Голден Стэйт Уорриорз: Часть 3
Прогнозирование модели на Python В этой заключительной части я начинаю с импорта библиотек и модулей - Pandas , NumPy , Matplotli b, Seaborn, Scikit-Learn , Statsmodels , копирования и построения - с последующим чтением обновленных CSV-файл с соответствующей статистикой. Я буду использовать статистические данные - возраст, 3P, 3P%, DRB, AST, BLK, AstTOVr и TS% - которые существенно коррелируют с победами, чтобы построить прогнозную модель, и посмотрю, насколько хорошо модель..

Пояснение к кривой валидации - построение графика влияния одного гиперпараметра
Участок с меньшим количеством кода! Экономьте время, чтобы интерпретировать это! В машинном обучении (ML) проверка модели используется для измерения эффективности модели ML. Хорошая модель машинного обучения не только очень хорошо подходит для обучающих данных, но также может быть обобщена на новые входные данные. Гиперпараметры модели играют важную роль в определении эффективности модели машинного обучения. С помощью поиска по сетке или рандомизированного поиска мы можем найти..

Лучшие библиотеки для Python и обработки естественного языка (обновлено ноябрь 2018 г.)
Библиотеки для науки о данных Это лучшие библиотеки, которые переводят Python из языка программирования общего назначения в мощный и надежный инструмент для анализа и визуализации данных. NumPy NumPy - это базовая библиотека или научный компьютер на Python, и многие из нижестоящих библиотек используют массивы NumPy в качестве входных и выходных данных. NumPy представляет объекты для многомерных массивов и матриц, а также процедуры, которые позволяют разработчикам выполнять..