Публикации по теме 'exploratory-data-analysis'


Машинное обучение и его использование в прогнозировании оттока
Как я построил модель машинного обучения для прогнозирования оттока с использованием модели случайного леса Лучше всего начать с объяснения того, что такое машинное обучение. Проще говоря, машинное обучение — это ветвь искусственного интеллекта, которая фокусируется на создании систем, использующих математические алгоритмы для изучения данных и прогнозирования аналогичных случаев в новой точке данных. Существует три основных типа алгоритмов: обучение с учителем, обучение без..

Давайте исследуем данные
Привет, мы снова здесь. Сегодня я расскажу вам о первом шаге, который мы, специалисты по данным, делаем в анализе данных. Великий «EDA» :) EDA означает «исследование данных». Так что же делает этот EDA? Почему мы это используем? Как мы его используем? и т. д. Не волнуйтесь, ответы на эти и другие вопросы вы получите уже сейчас. Итак, если вы готовы, приступим. В статистике исследовательский анализ данных (EDA) - это подход к анализу наборов данных для обобщения их основных..

Анализ личности клиента — Часть 1
Подробный исследовательский анализ данных Наука о данных произвела революцию в мире благодаря техническим преобразованиям. Теперь мы привыкли видеть множество приложений машинного обучения в нашей повседневной жизни. Но меня больше интересует, как машинное обучение может классифицировать людей на основе их личностных качеств. В этой статье я продемонстрирую анализ данных о личностях клиентов, чтобы извлечь значимую информацию из большого объема данных маркетинговой кампании. Это..

Инструменты для ускорения автоматизации EDA
В следующий раз вы можете использовать одну строку кода для автоматизации вашего EDA. вот как. Подготовка данных и EDA требуют много времени и усилий от специалистов по данным. Было бы неплохо иметь пакеты, которые позволяют вам быстро и быстро исследовать ваши данные. всего в несколько строк кода. я покажу вам 3 лучших пакета Python, которые могут автоматизировать ваши задачи по исследованию и анализу данных. 3 лучших пакета, которые автоматизируют EDA как части:..

Кроличья нора для исследовательского анализа данных COVID-19  — ML не требуется.
Наука о данных дала более широкое понимание окружающего мира, представляя идеи, выходящие за рамки того, что мы изначально искали. Так было, когда я несколько месяцев назад заканчивал проект с Covid-19. Проект начался с целью сбора данных о случаях и смертях от Covid-19 в США, штатах и ​​округах, а также составления прогнозов на следующие 30 дней. Я начал процесс обычным способом со сбора данных, их очистки и визуализации данных, чтобы увидеть, выделяется ли что-нибудь. Данные начали..

Прогнозирование безопасного вождения в Порту-Сегуро: ансамблевой подход
Никто не может насвистывать симфонию. Чтобы ее сыграть, нужен целый оркестр. - Х. Э. Люккок 1 - Постановка проблемы: ✦ P orto Seguro - одна из крупнейших в Бразилии компаний по страхованию автомобилей и домовладельцев. В этом соревновании задача состоит в том, чтобы построить модель, которая предсказывает вероятность того, что водитель подаст иск о автостраховании в следующем году. ✦ Полный проект можно найти здесь . ✦ Вы также можете связаться со мной в..

Простой исследовательский анализ данных (EDA) с профилированием Python и Pandas.
Чтобы начать построение модели машинного обучения или любого статистического анализа, мы должны пройти этап исследовательского анализа данных, то есть наблюдать за распределением данных, отсутствием значений, наличием выбросов, корреляционными характеристиками между переменными и прочим. Таким образом, для этого мы используем несколько изолированных функций и тестов, что затрудняет сбор информации в одном месте. Но как насчет использования инструмента, который собирает всю информацию из..