Публикации по теме 'data-preprocessing'


Три критически важные, но недооцененные концепции машинного обучения Python
Когда вы думаете о том, как подойти к проекту машинного обучения с учителем (ML), процесс, начиная с получения ваших данных и заканчивая развертыванием вашей модели, часто может показаться написанным всего за несколько шагов: Получите ваши данные и конвертируйте файл данных в желаемый формат Разделите данные на обучающий и тестовый наборы и выберите показатель производительности. Исследуйте и визуализируйте свои данные Очистите свои данные и выполните проектирование/выбор функций..

Руководство по разделению данных в машинном обучении
Создание проекта на основе машинного обучения обычно начинается с данных и заканчивается принятием решения на основе данных. Между этими двумя пунктами он включает в себя различные подэтапы, некоторые из которых являются обязательными, а некоторые мы используем для повышения производительности. Разделение данных — это один из тех подшагов, которые не только необходимы, но и при правильном выполнении мы можем получить плодотворные результаты от нашей модели. Итак, в этой статье мы..

Глава 2: Практическое машинное обучение с помощью Scikit-Learn и TensorFlow
Глава 2: Комплексный проект машинного обучения В этой главе мы будем работать над сквозным проектом ML, используя набор данных реального слова. Основные шаги в любом проекте машинного обучения Сформулируйте проблему. Соберите набор данных. Откройте для себя и визуализируйте данные, чтобы получить представление. Подготовьте данные для алгоритмов машинного обучения. Выберите модель и обучите ее. Настройте свою модель. Представьте свое решение. Кратко расскажем о каждом пункте...

От необработанных данных к уточненным: путь предварительной обработки данных — Часть 3: Дублированные данные
В этой статье объясняется, как идентифицировать повторяющиеся записи в данных и различные способы решения проблемы наличия повторяющихся записей. Почему наличие повторяющихся записей в данных является проблемой? Присутствие повторяющихся значений в данных часто игнорируется многими программистами. Но очень важно иметь дело с повторяющимися записями в данных. Наличие повторяющихся записей может привести к неправильному анализу данных и принятию решений. Например, что..

Глава 5 История предварительной обработки данных
Серия машинного обучения !!! Привет, народ, спустя столько времени я снова вернулся с новой статьей, которая дает вам лучшее понимание предварительной обработки данных. На самом деле предварительная обработка данных - это важный термин в машинном обучении. мы можем сказать, что это основная опора машинного обучения. Итак, после прочтения этой статьи вы сможете узнать, как работает предварительная обработка данных, почему она требуется, так что давайте начнем. Эта статья немного большая,..

Что такое препроцессинг данных и зачем он нам нужен❓
Предварительная обработка, как следует из названия, — это обработка чего-либо до того, как оно будет использовано или передано в каком-либо сценарии. Таким образом, предварительная обработка данных означает обработку перед подачей данных в модель глубокого обучения. В каждой проблеме машинного обучения или другой проблеме, где нашим основным фактором являются данные, предварительная обработка данных играет важную роль, которая включает в себя нормализацию данных, масштабирование данных,..

Применение линейной регрессии к набору данных о погоде
В этой статье мы обсудим, как применять шаги предварительной обработки, уменьшение размеров и построение линейной модели для реального набора данных. Набор данных был выбран из Kaggle , и он содержит реальные исторические данные о погоде с ежечасной / ежедневной сводкой для области Сегед, Венгрия с 2006 по 2016 год. Погода в Сегеде в 2006-2016 гг. Ежечасная / ежедневная сводка с температурой, давлением, скоростью ветра и др. www.kaggle.com..