Публикации по теме 'classification-algorithms'


Классификация K-ближайших соседей с нуля
Пошаговый пример в R без сторонних библиотек В этой статье мы рассмотрим пошаговый подход к созданию алгоритма K-ближайших соседей без помощи какой-либо сторонней библиотеки. На практике этот алгоритм должен быть достаточно полезен для нас, чтобы классифицировать наши данные всякий раз, когда мы уже сделали классификацию (в данном случае по цвету), которая послужит отправной точкой для поиска соседей. Для этого поста мы будем использовать определенный набор данных, который можно..

Логистическая регрессия
Что, если я скажу вам, что это алгоритм классификации. Логистическая регрессия Это алгоритм классификации, используемый для прогнозирования вероятности категориальной зависимой переменной от одной или нескольких независимых переменных. Однако, в отличие от линейной регрессии, зависимые переменные могут быть непрерывными или категориальными, а также вместо того, чтобы вписывать модель в прямую или гиперплоскость, логистическая регрессия использует логистическую функцию чтобы..

Логистическая регрессия: понимание математики, лежащей в основе алгоритма
Логистическая регрессия - это контролируемый алгоритм двоичной классификации . Вы, наверное, задаетесь вопросом, почему тогда это называется логистической регрессией, потому что для классификации используется концепция регрессии. Если это еще не имеет для вас смысла, не волнуйтесь, мы все разберем. В логистической регрессии целевое значение, которое мы хотим спрогнозировать, имеет значение ноль или один. Он либо принадлежит классу, поэтому значение равно 1, либо нет, и в этом случае..

Расширение целевой кодировки
"Начиная" Расширение целевой кодировки Использование целевой кодировки, когда ваши категориальные переменные имеют иерархическую структуру В самом начале этого тысячелетия, когда мои волосы были намного темнее, я написал небольшую статью с довольно длинным названием, озаглавленную « Схема предварительной обработки для категориальных атрибутов высокой мощности в задачах классификации и прогнозирования ». Это была простая статья, которую я решил написать, руководствуясь очень..

Деревья решений — это просто
Когда люди слышат слова randomForest, xgboost и GBM, за ними следует слово «черный ящик» — термин, который часто используется, когда люди не понимают алгоритм машинного обучения. Однако прошли те дни, когда люди не хотели понимать модели randomForest и слепо доверяли выходным данным, и это связано с тем, что методы ансамблевого/агрегированного дерева решений (например, randomForest) и алгоритмы, включающие ряд деревьев (например, xgboost), склонны к переоснащению; что приводит к отсутствию..

Использование машинного обучения, чтобы узнать, является ли боль в груди признаком болезни сердца или нет
Медицинское машинное обучение Использование машинного обучения, чтобы узнать, является ли боль в груди признаком болезни сердца или нет Разработка модели машинного обучения для определения наличия у человека сердечного заболевания по боли в груди и другим признакам. Предпосылки Перед тем, как приступить к проекту, вы должны иметь базовые знания: Python Pandas (библиотека анализа данных) Numpy (библиотека научных вычислений) Scikit Learn (для предварительной обработки данных..

Сравнение алгоритмов классификации - полиномиальный наивный байесовский алгоритм и логистическая регрессия
Заявление о проблеме В этой статье будет описан процесс сбора текстовых данных с reddit.com и оценки точности прогнозов алгоритмов классификации Multinomial Naive Bayes и Logistic Regression. Конкретные используемые текстовые данные собираются из сообщений субреддита PS4 и Xbox One с помощью Python Reddit API Wrapper, PRAW. Основная цель этого анализа - сравнить результаты полиномиальной наивной байесовской модели с моделью логистической регрессии, а также выявить плюсы и минусы обеих..