Публикации по теме 'sklearn'
Линейная регрессия — с использованием Python
Как мы знаем, машинное обучение — это ветвь искусственного интеллекта, которая занимается проектированием и разработкой алгоритмов, позволяющих машинам/компьютерам развиваться на основе эмпирических данных. Линейная регрессия — один из самых ранних методов в статистике, изобретенный антропологом сэром Фрэнсисом Гальтоном . Он разработал многие концепции и инструменты, используемые современными статистиками и приложениями машинного обучения.
Что такое линейная регрессия
Одержимость..
K Ближайшие соседи с использованием Numpy
В этой статье мы собираемся создать собственный алгоритм KNN с нуля и применить его к 23 различным наборам данных с использованием библиотек Numpy и Pandas.
Алгоритм K ближайших соседей
K Nearest Neighbours — один из самых простых алгоритмов прогнозирования в категории контролируемого машинного обучения.
Алгоритм работает на основе двух критериев: —
Количество соседей для включения в кластер. Расстояние соседей от точки тестовых данных.
На изображении выше показано..
Спектральная ко-кластеризация (с нуля)
Здесь мы обсудим метод кластеризации, который объединяет не только образцы, но и функции из данных. Бумага , из которой взят контекст, в значительной степени полагается на алгоритмы разбиения графа на кластеры документов и слов.
Мы разработаем собственный код и позже сравним его с существующим модулем CoClustering, доступным в python (sklearn).
Репозиторий Github для алгоритма, который будет объяснен ниже: -..
Я создал свой собственный набор данных о жилье и обучил модель машинного обучения прогнозировать цены на аренду.
Привет! В этой статье я хотел бы представить вам, как я создал свой собственный набор данных о жилье и обучил модель для прогнозирования цен на аренду. В моем проекте используются такие технологии, как Python, sklearn и Beautiful Soup. Я также пробовал различные алгоритмы машинного обучения, чтобы увидеть, какой из них будет наиболее эффективным. Добро пожаловать снова и давайте начнем наше путешествие :)
PS. Вы можете увидеть код в моем репозитории GitHub для лучшего понимания...
Как найти выбросы в наборе данных California House Price
Изучая машинное обучение, я столкнулся с концепцией выбросов, о которой я рассказал в своем последнем посте, который можно найти здесь: - https://medium.com/mlearning-ai/how-to-find-and -remove-outliers-from-a-regression-in-python-449bc9e13101
Я был настолько заинтригован концепцией выбросов, что решил попробовать функции sklearns в отношении этого на наборах данных, над которыми я ранее работал. Изучая выбросы, я обнаружил, что цены на жилье - это одна из областей, где..
Модель машинного обучения для прогнозирования цен на жилье.
В этом блоге я поделюсь своим опытом создания модели машинного обучения для прогнозирования цен на дома.
Я взял набор данных из здесь . Вы можете скачать набор данных отсюда или найти его в моем репозитории Github .
Теперь давайте быстро проверим тип и особенности данных. Изображение, показанное ниже, представляет собой CSV-файл данных с именем housing.data .
Теперь давайте проверим особенности и что они собой представляют.
Итак, на изображении вы можете..
Прогнозирование звезд с помощью GradientBoostingClassifier с помощью sklearn
Сценарий:
«В астрономии звездная классификация — это классификация звезд на основе их спектральных характеристик. Схема классификации галактик, квазаров и звезд — одна из самых фундаментальных в астрономии. Ранняя каталогизация звезд и их распределение на небе привели к пониманию того, что они составляют нашу собственную галактику, и, следуя различию, что Андромеда была отдельной галактикой от нашей, по мере создания более мощных телескопов начали исследовать многочисленные галактики...