Публикации по теме 'scikit-learn'


Анализ основных компонентов для данных о раке молочной железы с помощью R и Python
Алгоритм неконтролируемого машинного обучения для уменьшения размерности Привет еще раз! Сегодня мы обсудим один из самых популярных алгоритмов машинного обучения, который использует каждый специалист по данным - анализ главных компонентов (PCA) . Ранее я написал некоторое содержание для этой темы. Если вы еще не читали, вы также можете прочитать их по адресу: Анализ главных компонентов (PCA) с помощью Scikit-learn Статистические и математические концепции, лежащие в..

Разделение временных рядов с помощью Scikit-learn
Существует принципиальное различие между данными временных рядов и другими типами. Последовательный порядок наблюдений важен во временных рядах, поэтому нельзя использовать перетасовку или любой другой вид выборки, нарушающий последовательный порядок наблюдений. Тенденцию, сезонность и цикличность временных рядов важно учитывать, независимо от того, используете ли вы модели машинного обучения, модели ARIMA или любые другие. Поэтому вам нужно разделить данные таким образом, чтобы..

От Tweepy к тематическому моделированию с кластеризацией K-средних
Дают ли данные Twitter, относящиеся к крупному спортивному событию, представление об основных результатах? Разработка проекта текстовой аналитики сопряжена с многочисленными проблемами, первой из которых обычно является поиск обширных наборов данных. С этой целью здесь я представлю схему, с помощью которой каждый может получить доступ и проанализировать данные твитов Twitter. Твиттер содержит огромное количество текстовых данных, которые уникальны по своей природе, учитывая, что они..

Ускоренный курс по машинному обучению: введение и обзор
Машинное обучение — это область компьютерных наук, в которой используются статистические и вычислительные методы, позволяющие компьютерам учиться на данных и улучшать свою производительность при выполнении задач без явного программирования. Он может революционизировать многие аспекты нашей жизни, от здравоохранения и финансов до образования и развлечений. Машинное обучение становится все более популярным и важным в последние годы, и в настоящее время оно применяется для решения широкого..

Контролируемое машинное обучение для финансовой торговли (часть 4: использование классификатора дерева решений)
на Python доктора Элвина Анга https://www.alvinang.sg/s/Decision_Tree_Classifier_for_Financial_Trading_by_Dr_Alvin_Ang.ipynb Шаг 1: Установите библиотеки Шаг 2: Импорт набора данных и графика Шаг 3: Определите функции и цель Шаг 4: Тренировка тестового сплита Шаг 5: Масштабирование Шаг 6: определение, обучение модели и прогнозирование 6a) Определить и обучить модель 6b) Постройте дерево 6c) Используйте модель для..

Выбор правильного оценщика часто упускают из виду в науке о данных.
Выбор правильного оценщика часто упускают из виду в науке о данных. Когда дело доходит до трудностей, с которыми сталкиваются современные ученые, работающие с данными, часто видят как споры или очистку данных. Однако часто недооцененной проблемой является выбор правильной оценки или алгоритма машинного обучения. да, вы правильно поняли, даже для многих специалистов по данным, которые действительно хороши в науке о данных, иногда кажется, что выбор алгоритма похож на погоню за диким..

Машинное обучение с помощью scikit-learn
Это краткий справочник по применению контролируемого машинного обучения с использованием sklearn в Python. В этом руководстве предполагается, что вы знакомы с основными концепциями машинного обучения с учителем. Регрессия с использованием линейной модели Находит вес (w) и постоянный член (b), который минимизирует квадратичную ошибку модели (также называемую функцией потерь). Линейные модели не имеют каких-либо параметров для управления сложностью модели, однако предварительная..