Публикации по теме 'modeling'
Анализ и прогноз цен на жилую недвижимость в Вашингтоне: метод регрессии и ансамбля
Всем привет!! В этот момент я попытаюсь объяснить свой анализ набора данных, который я получил на kaggle. Набор данных о жилом районе Вашингтона. Итак, давайте начнем с объяснения этих данных.
Вашингтон, округ Колумбия, - столица США. Население Вашингтона приближается к 700 000 человек и растет с 2000 года после полувековой убыли населения. Город сильно изолирован и отличается высокой стоимостью жизни. В 2017 году средняя цена дома на одну семью в районе составляла 649 тысяч..
Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения
Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения
В отрасли науки о данных известно, что создавать модели ML относительно быстро и легко, но запускать их в производство сложно и дорого. Вы будете удивлены, узнав, что только небольшой процент проектов машинного обучения переходит в производство — только около 12% из них. ("источник")
Вот почему, внимательно изучив, что клиенты создавали с помощью пайплайнов Datagran, мы пришли к выводу, что извлечение..
Процесс моделирования Python/SKLearn
В этом блоге я расскажу о процессе настройки модели с помощью Python и SKLearn. Этот процесс используется каждый раз, когда вы планируете настроить и запустить модель, с небольшими изменениями на этом пути. Различия вступают в игру в зависимости от модели, которую вы выбираете для запуска, я постараюсь упомянуть некоторые из этих различий в этом блоге.
Для начала давайте напомним себе о рабочем процессе Data Science:
На этом этапе процесса я предполагаю, что вы выполнили шаги по..
Прогнозирование цен на жилье в Бостоне с использованием регрессионного анализа
Введение:
В этом проекте мы стремимся разработать регрессионную модель для прогнозирования цен на жилье в Бостоне на основе различных характеристик, таких как уровень преступности, количество комнат и доступность автомагистралей. Мы будем использовать набор данных Boston Housing, содержащий информацию о 506 домах в пригородах Бостона, для обучения и тестирования нашей модели.
Набор данных:
Набор данных Boston Housing был первоначально опубликован в 1978 году Харрисоном и..
LIME Light: объяснение моделей машинного обучения на простом английском языке
Модели машинного обучения добились значительных успехов в различных областях: от здравоохранения до финансов и обработки естественного языка. Однако прогнозы, генерируемые этими моделями, часто рассматриваются как непостижимые «черные ящики». Понимание того, почему модель дает тот или иной прогноз, имеет решающее значение для доверия, прозрачности и улучшения модели. Вот тут-то на помощь и приходит LIME.
Что такое ЛАЙМ?
LIME , что означает Локальные интерпретируемые..
Отрицательный R2: Где вы ошиблись?
СЕРИЯ ПО ТЕОРИЯМ
Отрицательный R2: Где вы ошиблись?
Статистический пример
Недавно я выполнил задачу машинного обучения и получил отрицательную метрику оценки R2 в своем тестовом наборе.
"Ждать! Разве R2 не… в квадрате? Разве он не должен быть между 0 и 1? Что я сделал?
Изначально я был очень обеспокоен состоянием моей задачи по машинному обучению. После пары минут гугления я остался лишь слегка обеспокоен состоянием моей задачи машинного обучения. В любом случае, я получил..
Машинное обучение - Введение в моделирование №2
При разработке моделей машинного обучения обученная модель должна хорошо работать с новыми или невидимыми данными. Мы разделяем наши существующие данные на 2 в качестве обучающих и тестовых наборов данных для имитации новых / невидимых данных. В частности, первая часть представляет собой большее подмножество данных, используемых в качестве обучающего набора (например, с учетом 80% исходных данных), вторая - меньшее подмножество и используется в качестве тестового набора (оставшиеся 20%..