Публикации по теме 'exploratory-data-analysis'


Представление Kaggle для набора данных Titanic
Исследовательский анализ данных и прогноз выживаемости с помощью алгоритма CatBoost. Привет, энтузиаст науки о данных. В этом сообщении в блоге я расскажу, как Kaggle представил набор данных Titanic. Мы выполним EDA для титанического набора данных, используя некоторые часто используемые инструменты и методы в Python. А затем создайте несколько моделей машинного обучения, чтобы предсказать целевые функции. Хотите пересмотреть, что такое EDA? Вот моя статья Введение в EDA . В..

Простые способы извлечения функций из переменной даты с помощью Python
Переменные даты - это особый тип категориальной переменной. Хотя на первый взгляд дата дает нам не что иное, как конкретную точку на временной шкале, при правильной предварительной обработке они могут значительно обогатить набор данных. Общие форматы даты содержат числа, а иногда и текст, чтобы указать месяцы и дни. Приведение дат в удобный формат и извлечение функций дат в новые переменные могут быть полезными этапами предварительной обработки. Например, из переменной даты вы можете..

Исследовательский анализ данных с помощью Python (часть 1)
Сколько раз вы сбивались с толку в части анализа данных для новичков? Я уверен, что много раз сталкивался с таким же. Итак, в этом посте я расскажу вам, как выполнять исследовательский анализ данных (EDA) с помощью Python. EDA - один из основных этапов анализа данных. Прежде чем вы начнете анализировать, очень важно понять данные. Вы должны быть знакомы с определенной терминологией, относящейся к типу данных, с которыми вы работаете. Например, вы работаете с любыми финансовыми..

[P8-DS] My Data Science Path, октябрь 2019 г. — 7-я неделя
Тема: Мой первый Kaggle Comp и вот как машинное обучение нас отвлечет Привет всем, добро пожаловать обратно в 7-й пост Мой путь науки о данных . Если вы не следили за моим блогом на прошлой неделе, пожалуйста, прочитайте его, чтобы вы могли понять, как я учусь и где я учусь. [P7-DS] My Data Science Path 2019 OCT — 6-я неделя Тема: Предварительная обработка данных для машинного обучения и углубление знаний в области машинного обучения . medium.com..

Понимание EDA: использование набора данных Iris Flower
В этой статье мы разберемся с основами исследовательского анализа данных (EDA) для построения графиков с использованием «Hello World !!» проект мира машинного обучения - Набор данных Iris Что такое EDA? Исследовательский анализ данных - это в основном задача анализа наших данных с использованием концепций из области статистики, линейной алгебры, инструментов построения графиков и других методов, чтобы понять, что представляет собой наш набор данных, прежде чем мы перейдем к..

Исследовательский анализ данных для игр League of Legends
Руководство специалиста по данным, как выиграть в большинстве игр. Это приквел к моей предыдущей статье Прогнозирование побед в League of Legends , в которой мы создали несколько моделей для прогнозирования исхода игры на основе нескольких внутриигровых функций. Эта статья и предыдущая основаны на наборе данных от Kaggle с более чем 9800 играми с высоким рейтингом. Контекст Если вы когда-либо играли в League of Legends, вы можете сказать, что многие игры напоминают..

Часть I: Искусство и наука исследовательского анализа данных (EDA)
Исследовательский анализ данных (EDA) , как следует из названия, представляет собой подход к анализу данных, в котором используются различные методы для определения лежащей в основе структуры, понимания переменных, обнаружения аномалий и, прежде всего, для получения максимальной информации для анализа. хорошая модель сборки. Другими словами, EDA помогает предоставить обзор качественной и количественной информации, чтобы избежать риска принятия неверных бизнес-решений на основе..