Публикации по теме 'modeling'


Анализ и прогноз цен на жилую недвижимость в Вашингтоне: метод регрессии и ансамбля
Всем привет!! В этот момент я попытаюсь объяснить свой анализ набора данных, который я получил на kaggle. Набор данных о жилом районе Вашингтона. Итак, давайте начнем с объяснения этих данных. Вашингтон, округ Колумбия, - столица США. Население Вашингтона приближается к 700 000 человек и растет с 2000 года после полувековой убыли населения. Город сильно изолирован и отличается высокой стоимостью жизни. В 2017 году средняя цена дома на одну семью в районе составляла 649 тысяч..

Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения
Оповещение о новой функции 🚨 Извлечение правил для моделей машинного обучения В отрасли науки о данных известно, что создавать модели ML относительно быстро и легко, но запускать их в производство сложно и дорого. Вы будете удивлены, узнав, что только небольшой процент проектов машинного обучения переходит в производство — только около 12% из них. ("источник") Вот почему, внимательно изучив, что клиенты создавали с помощью пайплайнов Datagran, мы пришли к выводу, что извлечение..

Процесс моделирования Python/SKLearn
В этом блоге я расскажу о процессе настройки модели с помощью Python и SKLearn. Этот процесс используется каждый раз, когда вы планируете настроить и запустить модель, с небольшими изменениями на этом пути. Различия вступают в игру в зависимости от модели, которую вы выбираете для запуска, я постараюсь упомянуть некоторые из этих различий в этом блоге. Для начала давайте напомним себе о рабочем процессе Data Science: На этом этапе процесса я предполагаю, что вы выполнили шаги по..

Прогнозирование цен на жилье в Бостоне с использованием регрессионного анализа
Введение: В этом проекте мы стремимся разработать регрессионную модель для прогнозирования цен на жилье в Бостоне на основе различных характеристик, таких как уровень преступности, количество комнат и доступность автомагистралей. Мы будем использовать набор данных Boston Housing, содержащий информацию о 506 домах в пригородах Бостона, для обучения и тестирования нашей модели. Набор данных: Набор данных Boston Housing был первоначально опубликован в 1978 году Харрисоном и..

LIME Light: объяснение моделей машинного обучения на простом английском языке
Модели машинного обучения добились значительных успехов в различных областях: от здравоохранения до финансов и обработки естественного языка. Однако прогнозы, генерируемые этими моделями, часто рассматриваются как непостижимые «черные ящики». Понимание того, почему модель дает тот или иной прогноз, имеет решающее значение для доверия, прозрачности и улучшения модели. Вот тут-то на помощь и приходит LIME. Что такое ЛАЙМ? LIME , что означает Локальные интерпретируемые..

Отрицательный R2: Где вы ошиблись?
СЕРИЯ ПО ТЕОРИЯМ Отрицательный R2: Где вы ошиблись? Статистический пример Недавно я выполнил задачу машинного обучения и получил отрицательную метрику оценки R2 в своем тестовом наборе. "Ждать! Разве R2 не… в квадрате? Разве он не должен быть между 0 и 1? Что я сделал? Изначально я был очень обеспокоен состоянием моей задачи по машинному обучению. После пары минут гугления я остался лишь слегка обеспокоен состоянием моей задачи машинного обучения. В любом случае, я получил..

Машинное обучение - Введение в моделирование №2
При разработке моделей машинного обучения обученная модель должна хорошо работать с новыми или невидимыми данными. Мы разделяем наши существующие данные на 2 в качестве обучающих и тестовых наборов данных для имитации новых / невидимых данных. В частности, первая часть представляет собой большее подмножество данных, используемых в качестве обучающего набора (например, с учетом 80% исходных данных), вторая - меньшее подмножество и используется в качестве тестового набора (оставшиеся 20%..