Публикации по теме 'categorical-data'


Управление кредитными рисками: EDA и разработка функций
Эта часть начинается с того, как очистить и предварительно обработать данные с помощью методов EDA и Feature Engineering для задачи классификации, особенно с использованием и без касания «целевой» переменной. Контекст Каковы наиболее частые случаи использования науки о данных в финансовой индустрии? Карты кредитного рейтинга - один из распространенных методов контроля рисков в финансовой отрасли, который использует личную информацию и транзакционные записи для выявления и оценки..

Как работать с категориальными переменными в прогнозной аналитике.
В прогнозной аналитике проектирование функций помогает вам разработать точную модель. нам нужно понимать и обрабатывать каждую входную функцию по-разному. Я хотел бы поделиться всеми проблемами, с которыми я столкнулся при работе с категориальными переменными. Что происходит, когда мы рассматриваем категориальную переменную как числовую или непрерывную переменную? У меня был неприятный опыт работы с категориальными переменными. Я помню, как работал над набором данных, где мне..

Представление категориальных данных в машинном обучении
Алгоритмы машинного обучения построены на основе математических функций, чтобы быть более понятными функциями функций. Эти алгоритмы пытаются найти относительность между точками данных, чтобы получить лучшее обобщение. Поскольку они являются математическими функциями, они не могут напрямую работать с категориальными данными, такими как строки или символы. Давайте углубимся и обсудим некоторые методы, используемые для представления категориальных данных, и то, как выбрать один из них..

Предварительная обработка данных и линейная регрессия
Предварительная обработка данных  – это метод интеллектуального анализа данных , который включает преобразование необработанных данных в понятный формат. Реальные данные часто бывают неполными, непоследовательными и/или в них отсутствуют определенные модели поведения или тенденции, а также может содержать много ошибок. Предварительная обработка данных — проверенный метод решения таких проблем. Он включает в себя очистку данных и заполнение пропущенных значений. Нам приходится..