Публикации по теме 'feature-importance'


Как найти нужные функции в машинном обучении
как использовать SHAP и Sci-Kit Learn Как определить, какие функции важны? Определение может быть сделано с использованием важности признаков. Существуют различные способы расчета важности функции, например: Важность функции на основе коэффициента Важность функции на основе перестановки Важность функции дерева ШАП Не все методы применимы ко всем типам моделей, но к большинству из них. Теперь мы углубимся в каждый метод подробнее. Важность функции на основе коэффициента..

6 типов «важности функции», о которых должен знать каждый специалист по данным
Полное руководство по «важности функций», одному из самых полезных (и все же скользких) понятий в ML. Важность функций — фундаментальная концепция для специалистов по машинному обучению. Благодаря своей простоте и интуитивности этот индикатор не только постоянно отслеживается специалистами по обработке и анализу данных, но и часто сообщается нетехническим специалистам по модели прогнозирования . Но, несмотря на интуитивность, идея «важности функции» также несколько расплывчата. На..

Использование оператора Execute Python для расчета важности функций в RapidMiner Studio
Важность выбора функции В машинном обучении одним из основных компонентов предварительной обработки данных является выбор признаков. Каждый столбец в наборе данных, который передается в нашу модель машинного обучения, называется функцией, также известной как переменная или атрибут. Если мы используем слишком много функций для обучения модели, модель может учиться на неважных шаблонах. Процесс выбора наиболее важных функций для разработки прогностической модели называется выбором..

Почему одной важности признаков недостаточно и необходим двумерный и многомерный анализ?
Введение: В области науки о данных и машинного обучения получение ценной информации из данных имеет решающее значение для принятия обоснованных решений. В то время как расширенные алгоритмы, такие как случайный лес и логистическая регрессия (регуляризация L1 и L2), могут обеспечить важность признаков, двумерный и многомерный анализ остается важным шагом в исследовании данных и разработке моделей. В этой статье мы рассмотрим, почему эти методы анализа все еще актуальны, несмотря на..

Интуитивно понятный прием для поиска важных функций в данных
Здравствуйте, читатели! В этой короткой публикации я покажу простой, но интуитивно понятный способ проверки релевантности функций в модели. Я научился этому трюку у лучших гроссмейстеров на Kaggle. Используя эту технику, мы можем быстро проверить значимость каждой функции и попытаться повысить ее значимость, применяя преобразования функций или даже отбрасывая их, если ничего не работает. Набор данных Kaggle ссылка . Интуиция: В идеале любая соответствующая функция должна..

Создание модели машинного обучения, позволяющей предсказать, не сможет ли претендент на получение кредита вернуть свой кредит!
В этом посте, вслед за моим предыдущим постом, который можно найти здесь , я объясню свой подход к предварительной обработке очищенных данных и моделированию Lending Club. Полную записную книжку можно найти здесь . Я применил несколько моделей классификации к очищенной базе данных принятых кредитов от Lending Club. Вкратце, Lending Club раньше был крупнейшей платформой однорангового кредитования. При принятии решения по заявке на кредит Lending Club полагается на информацию..

Использование машинного обучения для понимания эффективности облака Ишимоку в дневной цене…
В этой статье мы анализируем важность функций облака Ишимоку с помощью машинного обучения и оптимизированных бэктестов. В частности, мы рассмотрим пять основных линий технических индикаторов, составляющих родительский индикатор Ишимоку, на точность прогнозирования, поскольку обычно используемая модель торговли нейронной сетью LSTM учится создавать прибыльные стратегии. В настоящее время мы работаем над более исчерпывающим исследованием облака Ишимоку на основе машинного обучения и..