Публикации по тегам sklearn

Публикации по теме 'sklearn'

От слабого к сильному: расширение возможностей классификации с помощью Adaboost и python

Введение Мы все сталкивались с одним набором данных, на котором мы обучили несколько алгоритмов машинного обучения, надеясь, что мы встретим хотя бы один алгоритм, который хорошо работает с данными, но даже после применения различных методов, таких как оптимизация гиперпараметров, нормализация, масштабирование, извлечение признаков и другие мы все еще закончили с нежелательными результатами. В этой статье мы рассмотрим классификатор AdaBoost, который представляет собой контролируемый..

Простое машинное обучение и развертывание с помощью Python

Мне нравятся пакеты машинного обучения, которые может предложить Python. Однако это еще не все. Мое время в аспирантуре и в промышленности научило меня, что обучение оценке алгоритма машинного обучения — это только часть битвы. Прежде чем вернуться к изучению физики и, в свою очередь, стать инженером-программистом, я работала медсестрой в отделении неотложной помощи. Несмотря на то, что были некоторые заслуживающие внимания события, большинство ошибок, свидетелем которых я был, были..

Обнаружение сарказма с помощью машинного обучения

Полное руководство по EDA и технике машинного обучения для задач классификации предложений. Обзор проблемы Обнаружение сарказма — это узкая область исследования в НЛП, цель которой — определить, является ли предложение сатирическим или несаркастическим. Сарказм распространен в социальных сетях, газетах и имеет специфическое воздействие на слушателей, например, поддразнивание некоторых событий, нарушение их настроения ожиданий. Таким образом, правильное понимание иронии часто..

Использование дерева решений для выбора важных функций из набора данных (выбор функций, часть 2)

с помощью Scikit Learn in Python доктора Элвина Анга https://www.alvinang.sg/s/Using_Decision_Tree_Classifier_DTC_to_do_Feature_Importance_Selection_on_Iris_Dataset_by_Dr_Alvin_An.ipynb https://www.alvinang.sg/s/iris.csv Шаг 1. Прочитайте набор данных и разделите его на функции и цель import numpy as np import pandas as pd #from sklearn.preprocessing import LabelEncoder #from sklearn.model_selection import train_test_split # Read the Iris dataset into a Pandas DataFrame...

MLxtend для более умной интерпретации вашего классификатора

«Мы должны добавить некоторую регуляризацию, чтобы избежать переобучения». Это предложение часто используется блоггерами и ютуберами, занимающимися машинным обучением, для оправдания регуляризации слоев нейронной сети. Но лишь немногие объясняют логику регуляризации. В этом блоге я пытаюсь дать интуитивное обоснование важности регуляризации (L2). Интуиция Проще говоря, переобучение — это «слепое изучение» тренировочных данных. Как видно на рисунке ниже, переобученная модель..

Практический каталог для моделирования показателей оценки для машинного обучения

Овладейте искусством оценки моделей машинного обучения: подробное руководство по пониманию и использованию метрик классификации для повышения эффективности прогнозирования Оценка производительности модели машинного обучения имеет решающее значение. Чтобы оценить любой, во-первых, нам нужно определить нашу метрику. Существует множество различных показателей. Полезность каждого зависит от того, где он используется. Преимущество, которое он дает в проблеме, может обернуться недостатком..

7 наиболее часто задаваемых вопросов о кластеризации K-средних

Наиболее часто используемый неконтролируемый алгоритм кластеризации Фон Каждый день мы генерируем примерно 2,5 квинтиллиона байт данных. Эти данные принимают форму символов, чисел, текста, изображений, голоса и т. д. Неудивительно, что большинство этих данных не имеют меток , а полезные идеи скрыты под горой данных. Кластеризация – это метод обучения без учителя , который широко используется для поиска групп точек данных (называемых кластерами) со схожими характеристиками без..