Публикации по теме 'classification'


5 наиболее распространенных алгоритмов классификации для машинного обучения
В этом сообщении блога мы рассмотрим пять наиболее распространенных алгоритмов классификации, которые аналитики данных/ученые любят использовать при создании модели классификации. Если вы застряли на проблеме классификации и вам нужно выяснить, какую модель использовать, я надеюсь, что этот пост поможет вам понять, какие подходы стоит попробовать. Этот пост в блоге не будет вдаваться в код, но больше расскажет об идеях алгоритмов и их концепциях. Тем не менее, я поставлю ссылку для..

Как построить и применить наивную байесовскую классификацию для фильтрации спама
Модель для науки о данных Как построить и применить наивную байесовскую классификацию для фильтрации спама Простая реализация эффективной модели Я считаю, что сегодня почти у каждого есть смартфон, и у многих есть электронная почта или две. Это означает, что вы должны быть знакомы с множеством сообщений, предлагающих большие деньги, фантастические выигрыши в лотерею, отличные подарки и секреты жизни. Мы получаем десятки спамерских сообщений каждый день, если вы не используете..

Демистификация машин опорных векторов
Давайте поговорим об одном из самых мощных алгоритмов контролируемого машинного обучения - Support Vector Machine или SVM. Формально начнем с введения. Введение Машина опорных векторов или SVM - это контролируемый алгоритм машинного обучения, который обычно используется для задач классификации. Идею представили Владимир Николаевич Вапник и Алексей Я. Червоненкис в 1963 г., предполагая, что точки данных линейно разделимы. Позже Владимир Н. Вапник расширил эту первоначальную идею и..

Краткое руководство по LiDAR: часть 3
Научитесь выполнять надежную классификацию растительного покрова, используя окрестности NxN вокруг пикселя. Введение В последней части мы научились делать визуализацию и классификацию растительного покрова по высоте и интенсивности. В этой части мы рассмотрим, как выполнить более надежную классификацию, принимая во внимание соседство N x N вокруг пикселя. Соседняя область даст нам лучшее представление об изменении высоты и интенсивности вокруг этой точки. Если пиксель принадлежит..

Классификация пород собак с CNN
Следующий проект машинного обучения был завершен в рамках программы Data Scientist Nanodegree, которую я завершил в апреле 2020 года. Весь код можно найти на моем Github . 1. Введение Основная цель этого проекта - изображение собаки, алгоритм определит приблизительную породу собаки. Если он снабжен изображением человека, код идентифицирует похожую породу собаки. Во время проекта я создал CNN из Scatch и два CNN, используя технику Transfer Learning, используя разные архитектуры...

Классификация как форма контролируемого машинного обучения
Результатом контролируемого обучения является модель, полученная из размеченных обучающих данных. Это позволяет нам делать прогнозы о невидимых или будущих данных. Здесь термин контролируемый относится к набору выборок, где желаемые выходные сигналы (метки) уже известны. Фильтрация спама в электронной почте является примером контролируемого машинного обучения, которое мы используем ежедневно. В этом контролируемом машинном обучении модель обучается на ряде помеченных электронных..

Прекратите использовать SMOTE для лечения дисбаланса классов. Вместо этого используйте этот интуитивный подход
Вместо этого используйте этот интуитивный подход В задачах классификации, будь то бинарная или многоклассовая, будут случаи, когда количество наблюдений, принадлежащих каждому классу, несбалансировано. Типичным примером дисбаланса классов являются мошеннические и немошеннические транзакции, когда любая случайная выборка из всего нашего набора данных будет иметь значительно больше наблюдений немошеннических транзакций. Другим примером может быть набор данных об увольнении сотрудников,..