Публикации по теме 'classification'


Техника контролируемого машинного обучения для обнаружения аномалий: логистическая регрессия
Небольшие статьи по науке о данных об обнаружении аномалий Это 11-я (и последняя) часть из серии статей, которые я пишу об алгоритмах обнаружения аномалий. Ниже приведены 10 предыдущих статей, если вы хотите ознакомиться с ними, каждая из которых посвящена отдельному алгоритму обнаружения аномалий: 1. Изолированный лес 2. K-Ближайшие соседи (kNN) 3. Машины опорных векторов (SVM) 4. DBSCAN, неконтролируемый алгоритм 5. Эллиптический конверт 6. Фактор..

Может ли машина определять пол?
Может ли машина определять пол? Использование matplotlib для изучения 100-летнего существования имен в США и создание модели машинного обучения для классификации гендерной принадлежности по именам. Предисловие Наши имена не всегда определяют нас, но они дают нам чувство идентичности. Обозначение себя набором букв и слов придает некую структуру нашему самоощущению и закрепляет наше присутствие в этом мире. «Это не то, что они называют вас, это то, на что вы отвечаете». - У. К...

Часть 1: Оценка модели регрессии и классификации
Введение и интуиция, как оценивать регрессию и модель классификации в целом 1. Введение Специалисты по обработке данных часто используют модели машинного обучения для получения информации, но как же специалист по данным принимает решение, будет ли модель реализована или нет? Когда модель будет внедрена, это окажет негативное и позитивное влияние на бизнес. Чтобы предотвратить или минимизировать отрицательные воздействия, необходимо оценить модель, чтобы она могла оценить..

10 недель ML - Введение, неделя 1
Я решил писать статьи о моих лекциях по машинному обучению в моем университете. Я делаю это в качестве эксперимента, чтобы проверить, как я могу улучшить свой стиль обучения, и в то же время улучшить свои письменные и педагогические навыки. Более того, недавно у меня появилось желание заняться техническими статьями, и это казалось хорошим началом. Надеюсь, вам понравится этот материал. Контент, о котором я буду писать, взят из модуля 6 уровня машинного обучения Королевского колледжа..

Масштабирование функций
Feature Scaling — это метод предварительной обработки данных. Под предварительной обработкой мы подразумеваем преобразования, которые применяются к данным до того, как они будут переданы в какой-либо алгоритм для некоторой обработки. Что такое масштабирование функций? Масштабирование функций — это метод, при котором мы стандартизируем диапазон всех независимых функций набора данных. Его также называют нормализацией. Как правило, когда мы получаем необработанные данные, все значения..

Классификация текста - от набора слов до BERT - Часть 3 (fastText)
Эта история является частью серии Text Classification - From Bag-of-Words до BERT, реализующей несколько методов на Kaggle Competition под названием « Задача классификации токсичных комментариев » от Jigsaw (дочерняя компания Alphabet) . В этом конкурсе перед нами стоит задача построить многоголовую модель, способную обнаруживать различные типы токсичности, такие как угрозы, непристойность, оскорбления и ненависть на основе личных данных. Если вы не проверяли предыдущие..

Понимание логистической регрессии
Предварительное условие Прежде чем сразу перейти к этой статье, убедитесь, что вы знаете математику, лежащую в основе алгоритма линейной регрессии . Если нет, не о чем беспокоиться; прочтите эту статью ! Введение В этой статье делается попытка стать справочником, который вам нужен, когда дело доходит до понимания основных математических и статистических принципов алгоритма логистической регрессии. Логистическая регрессия - один из первых алгоритмов классификации , которые..