Публикации по теме 'scikit-learn'


Анализ данных и линейная регрессия
Цель статистики состоит в том, чтобы делать выводы о совокупности на основе информации, содержащейся в выборке. Популяции характеризуются такими параметрами, как среднее значение, медиана или стандартное отклонение. Модель поможет нам понять точную взаимосвязь между различными переменными и то, как они используются для прогнозирования результата. Рассмотрим один из наиболее часто используемых статистических методов в мире — регрессию. Регрессионный анализ — это моделирование..

Правильный способ использования показателей машинного обучения
Трудно выбрать правильный критерий точности для конкретной задачи. Стандартизированный подход - это то, что должен делать каждый специалист по данным. План этой статьи Мотивация Первое рассмотрение Должны знать меры точности для моделей машинного обучения Подход к использованию этих мер для выбора правильной модели машинного обучения для вашей проблемы Обратите внимание, что в этой статье я сосредоточен на проблемах бинарной классификации, но подход будет аналогичным для..

Предсказание расы с именами в Python
Сравнение 4 методов классификации Python scikit-learn для прогнозирования гонок Вы когда-нибудь сталкивались с демографическими данными, в которых у вас есть имена ваших клиентов, но данные об их расе неполны? Демографические данные расы полезны, когда дело доходит до понимания поведения ваших клиентов на другом уровне. Определенная раса может демонстрировать определенное поведение, которое может побудить вас выбрать определенный курс действий, чтобы привлечь больше из них в качестве..

Конвейер машинного обучения с помощью Scikit-Learn
Полный конвейер машинного обучения с помощью Scikit-Learn для энтузиастов машинного обучения Оглавление Это довольно длинный и обширный пост. Так что не торопитесь и возвращайтесь к нему столько раз, сколько необходимо. Вот схема этого поста, чтобы вам было легче ориентироваться в нем: "Я. Введение" II. Предварительная обработка данных III. Разработка функций IV. Выбор модели и гиперпараметр В. Оценка модели VI. Визуализация результатов «VII...

Проектирование и реализация многократно используемой библиотеки прогнозирования с расширяемостью и масштабируемостью
Прогнозирование — одна из наиболее часто запрашиваемых функций машинного обучения в компаниях Walmart. Хотя разные команды работают изолированно, создавая модели машинного обучения, часто они используют один и тот же набор пакетов с открытым исходным кодом, бесконечно повторяя усилия. Недавно мы разработали повторно используемую библиотеку прогнозирования ( RFL ), чтобы обойти эту ситуацию с помощью дизайна, ориентированного на масштабируемость и расширяемость одновременно. Цель состоит в..

Как я предсказал Indian Houserents с точностью 81%!
Люди, живущие в настоящее время в Индии, действительно сталкиваются с проблемой определения правильной арендной платы за дом в определенном месте города, и это проблема большого слона в комнате, которую большинство из нас склонны игнорировать. Чтобы пролить свет, а также дать представление о текущей ситуации на рынке недвижимости, я изо всех сил старался дать вам и всем другим читателям тенденцию или способы наблюдения за закономерностями в отношении арендной платы за дом! Прежде чем мы..

Выбор функций и регрессия в наборе данных Airbnb Berlin
Междисциплинарная область науки о данных может извлекать глубокие идеи и знания из структурированных и неструктурированных данных. Он объединяет концепции статистики, анализа данных и машинного обучения, а также другие связанные концепции для понимания и анализа реальных явлений с данными. Машинное обучение (ML) позволяет компьютерам учиться и интерпретировать без явного программирования. Методы машинного обучения широко используются в финансах, здравоохранении, материаловедении,..