Публикации по теме 'categorical-data'


СЛУЧАЙ БОЛЬШОЙ МОЩНОСТИ
НЕТ НИКАКИХ УЧЕНЫХ-ДАННЫХ! — часть 6 Случай беспорядков большой мощности Эта статья является частью нашей серии статей о том, как разные специалисты по обработке и анализу данных по-разному строят схожие модели. Нет одинаковых людей, и, следовательно, нет одинаковых специалистов по данным. И обстоятельства, при которых необходимо решать проблемы с данными, постоянно меняются. По этим причинам для выполнения поставленной задачи могут и будут использоваться различные подходы. В..

Обработка категориальных переменных. Основы
Введение Категориальные переменные — это распространенный тип данных, который можно найти во многих наборах данных машинного обучения. Однако большинство моделей машинного обучения не могут напрямую обрабатывать категориальные переменные, поскольку им требуются числовые данные. Цель этой записи в блоге — дать вам полное представление о том, как обрабатывать категориальные переменные в машинном обучении. Обладая этими знаниями, вы сможете включать в свои модели более мощные..

Машинное обучение со смешанными эффектами для категориальных переменных высокой мощности — Часть II: GPBoost…
Демонстрация GPBoost в Python и R с использованием реальных данных Категориальные переменные с высокой кардинальностью — это переменные, для которых количество различных уровней велико по сравнению с размером выборки набора данных. В Части I этой серии мы провели эмпирическое сравнение различных методов машинного обучения и обнаружили, что случайные эффекты являются эффективным инструментом для обработки категориальных переменных высокой мощности с помощью алгоритма GPBoost..

Каковы последствия кодирования категориальных защищенных атрибутов для справедливости?
Изучение влияния кодирования защищенных атрибутов на справедливость в машинном обучении Мы изучим мир кодирования категориальных атрибутов и его значение для моделей машинного обучения с точки зрения точности и справедливости. Категориальные атрибуты, такие как страна рождения или этническая принадлежность, играют решающую роль в определении наличия конфиденциальной информации в данных. Однако многим алгоритмам машинного обучения трудно напрямую обрабатывать категориальные атрибуты,..

Эффективное кодирование категориальных переменных для машинного обучения
Категориальная переменная — это распространенный тип данных, который можно найти во многих наборах данных машинного обучения. Эффективная обработка категориальных переменных может иметь решающее значение для построения успешных моделей, поскольку она содержит обширную информацию, которую можно использовать для прогнозирования результатов в машинном обучении. Однако работа с категориальными переменными может быть сложной задачей, поскольку многие модели предназначены для обработки..

Вот все, что вам нужно знать о кодировании категориальных данных (с помощью кода Python)
Здесь вы увидите несколько очень интересных методов кодирования данных для категориальных функций вашего проекта машинного обучения. Обзор Понять, что такое категориальное кодирование данных Изучите различные методы кодирования и когда их использовать Введение Производительность модели машинного обучения зависит не только от модели и гиперпараметров, но и от того, как мы обрабатываем и вводим в модель различные типы переменных. Поскольку большинство моделей машинного обучения..

Категориальные методы кодирования данных
Введение: Кодирование данных — важный этап предварительной обработки в машинном обучении. Это относится к процессу преобразования категориальных или текстовых данных в числовой формат, чтобы их можно было использовать в качестве входных данных для обработки алгоритмов. Причина кодирования в том, что большинство алгоритмов машинного обучения работают с числами, а не с текстом или категориальными переменными. Основная цель этой тетради — понять Что такое категориальные данные и..