Публикации по тегам sklearn

Публикации по теме 'sklearn'

Прогнозирование возраста краба при выращивании грязевых крабов с использованием машинного обучения

Обзор Крабоводство является основным видом деятельности аквакультуры, поскольку в Индии существует огромный потребительский спрос на крабов. Коммерческое разведение крабов — это растущий бизнес в прибрежных районах Индии, который выглядит прибыльным. Грязевой краб очень популярен из-за большого спроса на экспортном рынке. Разведение грязевых крабов в коммерческих масштабах быстро развивается в прибрежных районах Андхра-Прадеша, Тамилнада, Кералы и Карнатаки. О грязевых крабах..

Понимание того, как машинное обучение может классифицировать рукописные цифры

Как компьютеры понимают изображения на примере Мы уже говорили об этом раньше. Компьютеры понимают числа. Не текст. Не видео. Не изображения. Как же тогда модели машинного обучения могут извлекать текст из изображений рукописных символов? Давайте посмотрим на изображение рукописной цифры 9, которое мы извлечем из модуля наборов данных sklearn. # import datasets module from sklearn import datasets # grab the digits dataset from the module digits = datasets.load_digits() #..

scikit узнать шпаргалку по Sklearn

Sklearn может быть первой платформой машинного обучения, которую вы изучили. Исследователям нравится его API за простоту использования и идеальную гибкость при создании прототипов. Сегодня специалисты по машинному обучению, исследователи данных Kaggle и участники хакатона используют библиотеку в сочетании с такими средами глубокого обучения, как Pytorch и Tensorflow, для разделения данных, предварительной обработки и обработки отсутствующих значений и значений NaN. Шаблон кода API Sklearn..

Предварительная обработка данных

Очевидно, что для любой задачи в области науки о данных данные являются самым важным. Дело только в том, что большую часть времени мы не получаем данные в их самой красивой форме. Необработанные данные часто бывают неполными, непоследовательными и могут содержать много ошибок. В большинстве случаев специалисты по данным тратят 70% своего времени на очистку своих наборов данных. Очищенный набор данных обеспечивает гораздо лучшее понимание, визуализацию и прогнозы. Данные в основном..

Анализ дорожно-транспортных происшествий в Калифорнии

Авторы Ройи Рази , Ариана Гордон , Эяль Хашимшони и Эран Перельман Дорожные столкновения в США - обычное явление. Набор данных с открытым исходным кодом с информацией о дорожных столкновениях, произошедших в штате Калифорния в период с января 2001 г. по середину октября 2020 г., доступен на сайте kaggle . Мы использовали этот набор данных для прогнозирования серьезности травм в результате дорожно-транспортного происшествия. Если мы сможем точно предсказать серьезность..

Подробнее: настройка параметров для KNN

В этом посте мы рассмотрим наиболее важные параметры классификатора Sklearn KNeighbors и то, как они влияют на нашу модель с точки зрения переобучения или недостаточного подбора. Этот классификатор реализует голосование k-ближайших соседей. Мы будем использовать Titanic Data from kaggle . Ради этого поста мы будем выполнять как можно меньше функций, поскольку это не является целью этого поста. import numpy as np import pandas as pd import matplotlib.pyplot as plt Загрузить..

Стандартизируйте решение задач машинного обучения с помощью SKlearn Pipeline — Часть 1

Хотя для большинства новичков и учащихся эта тема может быть необязательной или последней, она может оказаться полезной для тех, кто использует методы машинного обучения для решения своих бизнес-задач. Стандартизация — это очень общее слово, которое включает в себя работу с различными аспектами процесса решения проблем. Здесь и в следующих нескольких статьях мы ограничиваем объем обсуждения использованием модуля конвейера sklearn и его использованием, а затем тем, как использовать MLFlow..