Публикации по теме 'sklearn'


Алгоритм случайного леса с нуля
Мы можем видеть на картинке выше, есть много деревьев. По сути, это изображение леса, в котором много деревьев. В этой статье я познакомлю вас с алгоритмом случайного леса . Итак, я подумал сначала познакомить вас с лесом. Разве не интересно? Итак, начнем. Алгоритм случайного леса — это контролируемый алгоритм обучения, обычно используемый для задач классификации. Да, мы можем использовать его и для задач регрессии. Я хотел бы рассказать вам небольшой пример, чтобы вы могли..

Создайте множественную линейную регрессию, используя sklearn (Python)
Множественная линейная регрессия используется для прогнозирования независимой переменной на основе нескольких зависимых переменных. В этой статье я расскажу, как вы можете предсказать выбросы Co2, используя sklearn (библиотека Python) + математические обозначения. Почему мы используем множественную линейную регрессию? Чтобы определить силу влияния независимой переменной на зависимую переменную, например: влияет ли посещаемость лекций и пол на успеваемость студентов на экзаменах?..

Я настоятельно рекомендую использовать более продвинутые алгоритмы для настройки вашей SVM.
Я настоятельно рекомендую использовать более продвинутые алгоритмы для настройки вашей SVM. Оптимальная настройка дает точность 97,6% ! Сила SVM на самом деле заключается в оптимальной настройке параметра ядра и параметра регуляризации. Это легко сделать с помощью Optunity (который использует алгоритм Нелдера-Мида). Небольшой пример кода, как я настраивал SVM: # red_feature_matrix => the reduced training set # red_labels => the corresponding labels of reduced training set..

Быстро протестируйте несколько моделей
Как эффективно обучать и оценивать несколько моделей Вступление Вопрос, с которым должны столкнуться все специалисты по обработке данных при работе над любым проектом машинного обучения: Какая архитектура модели лучше всего подходит для моих данных? Следует принять во внимание несколько теоретических соображений. Например, если ваши функции демонстрируют сильные линейные отношения с вашей зависимой переменной (целью), то линейная модель, вероятно, будет работать лучше всего...

Добавление самонастройки размера кластера в алгоритм спектральной кластеризации в scikit-learn.
Часто мы сталкиваемся с большими объемами данных и хотим иметь метод обнаружения похожих групп. Здесь в игру вступает область кластеризации векторов. Вместо того, чтобы вручную выбирать каждую группу, мы можем получить алгоритм, который сделает всю тяжелую работу за нас. Какой метод кластеризации? Существует множество различных методов кластеризации, от часто используемой кластеризации k-средних до непараметрических алгоритмов на основе плотности, таких как DBSCAN и OPTICS — просто..

Развертывание моделей машинного обучения для приложений Ruby с помощью PyCall
Развертывание моделей машинного обучения для приложений Ruby с помощью PyCall Раньше мы обучили действительно простую модель, которая предсказывала уровень дохода от ‹ = 50K до ›50K . Это была очень простая задача классификации, для которой мы могли использовать Sklearn-porter для генерации кода Ruby на основе обученной модели. К сожалению, Sklearn-porter не поддерживает никаких алгоритмов регрессии и только ограниченный набор алгоритмов классификации. Это ограничение может..

Наглядное руководство по пониманию алгоритма случайного леса
Понимание внутренней работы алгоритма случайного леса О чем эта статья В этой статье мы увидим, как алгоритм случайного леса работает внутри. Чтобы по-настоящему оценить это, было бы полезно немного разобраться в классификаторах дерева решений. Но это не совсем обязательно. 👉 Примечание : мы не рассматриваем этапы предварительной обработки или создания функций, связанные с моделированием, а только смотрим, что происходит внутри алгоритма когда мы вызываем методы .fit()..