Публикации по теме 'classification'


Прогнозирование фондового рынка с помощью настроений в заголовках новостей (первый удар)
Ага! вы правильно прочитали. Я решил сделать свой первый пост на Medium и предсказать фондовый рынок (я отчетливо слышу, как закатываются глаза, когда пишу эти строки). Я взял эту идею из набора данных this в Kaggle, который содержит 25 самых популярных ежедневных новостей с 2008 по 2016 год на основе канала Reddit WorldNews. Этот набор данных также содержит метки, обозначающие, закрылся ли индекс Доу-Джонса выше или ниже в течение дня за один и тот же период времени. Для моей первой..

Прогнозирование сердечных заболеваний с помощью машинного обучения
Проблемы классификации - одна из наиболее распространенных областей, где алгоритмы машинного обучения применяются с отличными результатами. Самая большая разница между проблемой регрессии и проблемой классификации состоит в том, что в задаче классификации целевая переменная является категориальной / двоичной. В этой статье мы рассмотрим набор данных о сердечном ритме, опубликованный репозиторием машинного обучения UCI, где целевой переменной является болезнь сердца. Мы рассмотрим несколько..

Простая модель K-ближайшего соседа
KNN - это контролируемый обучающийся алгоритм классификации и регрессии, который использует близлежащие точки для создания прогноза. Я коснусь некоторых основных, но важных концепций, которые нужно понять о моделях KNN. Позже я приведу пример модели KNN, которую я тестировал. Шаги: Понимание метрик расстояния Кодирование Стратегии поиска лучшего K-Value (pssst, используйте gridsearch!) Как оценить эффективность вашей классификации: Точность, отзывчивость, точность, F1-рейтинг ...

Оценка модели машинного обучения
Итак, вы обучили свою модель машинного обучения. Возможно, вы создали проект, который может обнаруживать пневмонию в легких или фильтровать текст . Отсюда вы должны спросить себя: Как я узнаю, что эта модель будет успешной? Как он будет работать в производстве? Чтобы ответить на этот важный вопрос, нам нужно понять, как оценивать модель машинного обучения. Это одна из основных задач в рабочем процессе машинного обучения, и прогнозирование и планирование успеха модели в..

Алгоритм K-ближайших соседей
В этом блоге я расскажу об алгоритме K-Nearest Neighbours. Итак, приступим. Представьте себе, что поставщик телекоммуникационных услуг сегментировал свою клиентскую базу по шаблонам использования услуг, разделив клиентов на четыре группы. Если демографические данные можно использовать для прогнозирования членства в группе, компания может настраивать предложения для отдельных потенциальных клиентов. Это проблема классификации. То есть, учитывая набор данных с предопределенными метками,..

Искусство превращения ретроспективного взгляда в предвидение ~ теорема Байеса!
«Взгляд в прошлое - прекрасная вещь, но предвидение лучше, особенно когда речь идет о спасении жизни или некоторой боли!» - Уильям Блейк Это мудрые слова, о которых часто говорят позже. Если бы только у нас была возможность заранее знать, что не сработает, верно? Интересно, что теорема Байеса предполагает, что мы можем использовать ретроспективу как предвидение и принимать решения, изменяющие жизнь. Давайте попробуем понять последствия этого, рассмотрев типичную ситуацию с..

Исследовательский анализ данных на IRIS DATASET
EDA - это задача анализа данных на основе статистики, простых инструментов построения графиков, линейной алгебры и других методов, чтобы понять, что такое набор данных, прежде чем мы перейдем к реальному машинному обучению. Здесь я хотел бы объяснить различные операции анализа данных, которые я проделал с этим набором данных. 0. Описание данных Набор данных о цветках ириса - это особый набор информации, собранный биологом Рональдом Фишером в 1930-х годах. Набор данных содержит 3..