Публикации по теме 'sklearn'


Линейная регрессия — с использованием Python
Как мы знаем, машинное обучение — это ветвь искусственного интеллекта, которая занимается проектированием и разработкой алгоритмов, позволяющих машинам/компьютерам развиваться на основе эмпирических данных. Линейная регрессия — один из самых ранних методов в статистике, изобретенный антропологом сэром Фрэнсисом Гальтоном . Он разработал многие концепции и инструменты, используемые современными статистиками и приложениями машинного обучения. Что такое линейная регрессия Одержимость..

K Ближайшие соседи с использованием Numpy
В этой статье мы собираемся создать собственный алгоритм KNN с нуля и применить его к 23 различным наборам данных с использованием библиотек Numpy и Pandas. Алгоритм K ближайших соседей K Nearest Neighbours — один из самых простых алгоритмов прогнозирования в категории контролируемого машинного обучения. Алгоритм работает на основе двух критериев: — Количество соседей для включения в кластер. Расстояние соседей от точки тестовых данных. На изображении выше показано..

Спектральная ко-кластеризация (с нуля)
Здесь мы обсудим метод кластеризации, который объединяет не только образцы, но и функции из данных. Бумага , из которой взят контекст, в значительной степени полагается на алгоритмы разбиения графа на кластеры документов и слов. Мы разработаем собственный код и позже сравним его с существующим модулем CoClustering, доступным в python (sklearn). Репозиторий Github для алгоритма, который будет объяснен ниже: -..

Я создал свой собственный набор данных о жилье и обучил модель машинного обучения прогнозировать цены на аренду.
Привет! В этой статье я хотел бы представить вам, как я создал свой собственный набор данных о жилье и обучил модель для прогнозирования цен на аренду. В моем проекте используются такие технологии, как Python, sklearn и Beautiful Soup. Я также пробовал различные алгоритмы машинного обучения, чтобы увидеть, какой из них будет наиболее эффективным. Добро пожаловать снова и давайте начнем наше путешествие :) PS. Вы можете увидеть код в моем репозитории GitHub для лучшего понимания...

Как найти выбросы в наборе данных California House Price
Изучая машинное обучение, я столкнулся с концепцией выбросов, о которой я рассказал в своем последнем посте, который можно найти здесь: - https://medium.com/mlearning-ai/how-to-find-and -remove-outliers-from-a-regression-in-python-449bc9e13101 Я был настолько заинтригован концепцией выбросов, что решил попробовать функции sklearns в отношении этого на наборах данных, над которыми я ранее работал. Изучая выбросы, я обнаружил, что цены на жилье - это одна из областей, где..

Модель машинного обучения для прогнозирования цен на жилье.
В этом блоге я поделюсь своим опытом создания модели машинного обучения для прогнозирования цен на дома. Я взял набор данных из здесь . Вы можете скачать набор данных отсюда или найти его в моем репозитории Github . Теперь давайте быстро проверим тип и особенности данных. Изображение, показанное ниже, представляет собой CSV-файл данных с именем housing.data . Теперь давайте проверим особенности и что они собой представляют. Итак, на изображении вы можете..

Прогнозирование звезд с помощью GradientBoostingClassifier с помощью sklearn
Сценарий: «В астрономии звездная классификация — это классификация звезд на основе их спектральных характеристик. Схема классификации галактик, квазаров и звезд — одна из самых фундаментальных в астрономии. Ранняя каталогизация звезд и их распределение на небе привели к пониманию того, что они составляют нашу собственную галактику, и, следуя различию, что Андромеда была отдельной галактикой от нашей, по мере создания более мощных телескопов начали исследовать многочисленные галактики...