Публикации по теме 'exploratory-data-analysis'


EDA С ПРОФИЛИРОВАНИЕМ PANDAS
Исследовательский анализ данных (EDA) используется учеными для анализа и исследования наборов данных, обобщения их основных характеристик, часто с использованием методов визуализации данных, а также для обнаружения закономерностей, обнаружения аномалий, проверки гипотезы или проверки предположений. EDA помогает нам увидеть, что данные могут нам сказать, прежде чем сделать предположение или задачу моделирования. Это также помогает выявлять очевидные ошибки, а также понимать..

На шумных улицах Лондона Лондонская пожарная команда (LFB) стоит как маяк безопасности, неустанно работая для защиты жизней и…
На шумных улицах Лондона Лондонская пожарная команда (LFB) является маяком безопасности, неустанно работая над защитой жизни и имущества. Поскольку город продолжает расти, становится все более важным оптимизировать время реагирования экстренных служб. В этом сообщении блога мы отправляемся в захватывающее путешествие по миру интеллектуального анализа данных и машинного обучения, где мы изучаем возможности анализа экстренных вызовов и раскрываем ценные идеи, которые могут помочь повысить..

Исследовательский анализ данных и прогнозное моделирование автомобильных аварий в США
Введение Ежегодно на дорогах США происходят тысячи аварий, приводящих к гибели людей, травмам и материальному ущербу. Методы прогнозного моделирования могут использоваться для анализа и прогнозирования серьезности аварий, что может помочь в разработке эффективных мер по предотвращению аварий и уменьшению их последствий. В этой статье мы рассмотрим набор данных о дорожно-транспортных происшествиях в США, доступный на Kaggle, который содержит информацию о более чем 2,6 миллионах аварий..

От необработанных данных к уточненным: путь предварительной обработки данных — Часть 3: Дублированные данные
В этой статье объясняется, как идентифицировать повторяющиеся записи в данных и различные способы решения проблемы наличия повторяющихся записей. Почему наличие повторяющихся записей в данных является проблемой? Присутствие повторяющихся значений в данных часто игнорируется многими программистами. Но очень важно иметь дело с повторяющимися записями в данных. Наличие повторяющихся записей может привести к неправильному анализу данных и принятию решений. Например, что..

Прогнозирование цены автомобиля с помощью машинного обучения
Автомобили являются одним из видов транспорта, который есть у людей. Некоторые люди покупают автомобили для ежедневного использования. Некоторые люди покупают автомобили, потому что у них остались хорошие воспоминания о прошлом. Некоторые даже купили машину, чтобы пополнить свою коллекцию. Чтобы купить машину, нужно много думать, например, о цене. Какова правильная цена автомобиля? Чтобы ответить на этот вопрос, я попытался помочь, построив модель машинного обучения, которая..

Прогнозирование недостающих материалов в управлении запасами
Это пошаговое руководство по моему тематическому исследованию и моему подходу к исследовательской статье, представленной на конференции IEEE, 2017. Авторы статьи рассмотрели несбалансированный набор данных реального мира, доступный на конкурсе Kaggle Можете ли вы предсказать отставание по продукту?. Мы подробно рассмотрим, как можно минимизировать просроченные заказы на материалы во время управления запасами. Но перед этим давайте разберемся, что такое просроченные заказы и как с..

Быстро приступите к обучению с учителем с помощью dabl
Машинное обучение с учителем стало более доступным для новичков Лучшее понимание данных и задачи, а также более подходящие функции чаще всего приводят к значительному повышению производительности. В dabl есть несколько инструментов, которые позволяют легко очищать и проверять ваши данные и создавать надежные базовые модели. Эта библиотека пытается помочь сделать машинное обучение с учителем более доступным для начинающих и уменьшить количество шаблонов для общих задач. Это..