Публикации по теме 'classification-models'


Классификация случайных лесов (RF) по набору данных — данные кардиотокографии — с R-скриптом (часть 3)
Эта статья посвящена применению случайных лесов для классификации состояния плода (N = нормальное, S = подозрительное, P = патологическое) набора данных Cardiotocogaphy. Это третья часть моего проекта. Прочтите статью ниже, чтобы узнать больше о наборе данных и о том, как выполнить EDA. UCI: «Набор данных кардиотокографии — Классификация состояния плода — Часть 1: Сводка данных и EDA 1. Сводка данных и описание задачи классификации..

Как построить классификационную модель с помощью apache spark
Первоначально опубликовано на https://www.niit.com/india/ Apache Spark — это секретная система обработки с открытым исходным кодом, используемая для рабочих нагрузок с большими данными . Он использует кэширование в памяти и оптимизированное выполнение запросов для быстрых запросов к данным любого размера. Другими словами, Spark — это очень быстрый и универсальный движок, используемый для крупномасштабной обработки данных. Библиотека Spark для машинного обучения известна как..

Улучшение ваших моделей классификации с помощью необходимых статистических тестов.
Достижение лучших характеристик с помощью исследовательского анализа данных можно улучшить с помощью статистических методов для принятия решений. Эти статистические тесты не только дают лучшие характеристики, но и дают пользователю представление о том, какой прогресс был достигнут для получения хорошего набора данных. Здесь мы собираемся обсудить некоторые из наиболее полезных статистических тестов, применимых к моделям классификации. Давайте возьмем пример набора данных о раке груди в..

Моделирование оттока клиентов? Начните здесь
Один из наиболее важных KPI для любого бизнеса - это уровень удержания клиентов, то есть какой процент клиентов совершит повторную покупку. Чем выше показатель удержания - тем счастливее владелец бизнеса. Мы часто думаем, что показатель оттока дополняет показатель удержания: показатель оттока = 1 - показатель удержания Это имеет смысл, когда бизнес продает подписку: если клиент не продлил подписку, он отказался от нее. Однако, когда продаются продукты , эта точка зрения неверна:..

Машина опорных векторов.
Машины опорных векторов (SVM) - это мощные, но гибкие алгоритмы контролируемого машинного обучения, которые используются как для классификации, так и для регрессии. Но обычно они используются в задачах классификации. В 1960-х годах SVM были впервые представлены, но позже они были усовершенствованы в 1990 году. SVM имеют свой уникальный способ реализации по сравнению с другими алгоритмами машинного обучения. В последнее время они чрезвычайно популярны из-за их способности обрабатывать..

Логистическая регрессия для классификации клиентов — один против всех (4/4)
Классификация данных о ваших клиентах может оказаться непростой задачей. Вам нужно правильно ответить на вопросы, а затем отправить своих продавцов, чтобы они собрали для вас данные. Если для этого вам нужен хороший пакет, смело пробуйте Рапидтрейд . пс. Скачать исходники можно здесь , а если вам нужно введение в логистическую регрессию, то можно начать со статьи 1 . Итак, давайте посмотрим на этот набор данных, загруженный с Kaggle . Вот некоторые моменты, которые следует..

Прогнозирование литологии нефтяных месторождений на основе данных бурения с использованием машинного обучения
Практический рабочий процесс и извлеченные уроки В последнее время в нефтегазовой отрасли мы находим довольно много приложений машинного обучения. В прошлом году я написал еще одну статью о предсказании акустического каротажа, которая на удивление получила столько откликов, и эта работа быстро распространилась. Еще одно приложение ML - прогноз литологии. Литология относится к типу горных пород. Литология подразделяется, например, на песчаник, аргиллит, мергель, известняк и..