Публикации по теме 'feature-selection'


Стратегии выбора функций для регрессионных моделей
Ro Data Sip-and-Share Q1 2019 Выбор функций или их отсечение - очень важный шаг в конвейере построения хорошей модели прогнозирования и понимания связей между функциями и целью. Выбор функций преследует две цели: 1. выявить и удалить элементы с небольшой или отсутствующей предсказуемостью цели, чтобы предотвратить переоснащение, и 2. выявить сильно коррелированные или избыточные функции и подавить негативное влияние на модель без потери важной информации. . Здесь я рассмотрю..

Подробное изучение методов машинного обучения для выбора функций в Python — часть 1
Выбор функций на основе ИИ в Python! Подробное изучение методов машинного обучения для выбора функций в Python — часть 1 Первая часть серии статей о выборе признаков на основе машинного обучения, в которой мы обсуждаем популярные методы фильтрации, такие как Пирсон, Спирмен, точечная двухрядная корреляция, критерий Крамера v и информационная ценность. «Мусор на входе, мусор на выходе!» Это фраза, которую рано или поздно поймет любой, кто создает модели машинного обучения. Это..

Важность корреляционного анализа при выборе признаков для машинного обучения
Что такое корреляция? Корреляция используется для нахождения взаимосвязи между двумя переменными, что важно в реальной жизни, поскольку мы можем предсказать значение одной переменной с помощью других переменных, которые коррелируют с ней. Это тип двумерной статистики, поскольку здесь задействованы две переменные. Это статистический метод , который помогает нам анализировать взаимосвязь между двумя или более переменными. Некоторые статистики определяют корреляцию следующим образом:..

Выбор функций и регрессия в наборе данных Airbnb Berlin
Междисциплинарная область науки о данных может извлекать глубокие идеи и знания из структурированных и неструктурированных данных. Он объединяет концепции статистики, анализа данных и машинного обучения, а также другие связанные концепции для понимания и анализа реальных явлений с данными. Машинное обучение (ML) позволяет компьютерам учиться и интерпретировать без явного программирования. Методы машинного обучения широко используются в финансах, здравоохранении, материаловедении,..

Алгоритм создания искусственной пчелиной колонии
Алгоритм искусственной пчелиной колонии (ABC) — это алгоритм оптимизации Swarm Intelligence, вдохновленный функционированием медоносных пчел, пытающихся найти лучшие ресурсы нектара, окружающие их пчелиный улей. Дервиш Кара-Богаз впервые предложил этот алгоритм в 2005 году. Этот алгоритм использовался во многих формах оптимизации сложных нелинейных функций. Как вы скоро увидите, этот алгоритм зависит от случайности ситуации, это отличная область применения лучших стратегий для еще более..

Взаимная информационная оценка — Выбор функций
используя энтропию из теории информации Всем привет, как жизнь? еще один день в раю? Большой. Сегодня мы рассмотрим уникальный способ выбора признаков с использованием взаимной информации. Как правило, мы рассматриваем метод выбора признаков для числовых входных данных и числовой целевой переменной двумя способами. Они есть: Статистика корреляции #Multi colineartiy — — — — — — — — — — — — — — corr_matrix = X.corr().abs() #выбираем верхний треугольник upper =..

Поиск наиболее важных функций в наборе данных с использованием критериев взаимной информации
Выбор функций с использованием регрессии взаимной информации Цель. Определить важные функции в наборе данных, которые действуют как предикторы для целевой переменной, в данном случае математических оценок. Набор данных. Набор данных содержит математические оценки и множество возможных переменных-предикторов, таких как размер семьи, доступ в Интернет дома, работа отца и т. д. Всего имеется 31 переменная. Подход. Здесь мы будем использовать немного другой подход. Вместо того,..