Публикации по теме 'data-visualization'


Цветовые шкалы - это все в визуализации данных - правильно ли вы их используете?
Как выбор правильного цвета и масштабов может сделать или сломать ваше сообщение (с примерами и кодом Python) Возможно, вы видели эту карту COVID , о которой сначала сообщил andishenouraee в Твиттере, а затем она была освещена в средствах массовой информации. Даже если да, взгляните еще раз. Если нет, то это картограммы, на которых показаны случаи заболевания Covid-19 в каждом округе (с июля 2020 года) в штате Джорджия. Две карты кажутся очень похожими, но наблюдатели среди вас могли..

Линейный дискриминантный анализ Фишера в Python с нуля
Линейный дискриминантный анализ Фишера (LDA) - это алгоритм уменьшения размерности, который также можно использовать для классификации. В этом сообщении блога мы узнаем больше о LDA Fisher и реализуем его с нуля на Python. LDA? Линейный дискриминантный анализ (LDA) - это метод уменьшения размерности. Как следует из названия, методы уменьшения размерности сокращают количество измерений (то есть переменных) в наборе данных, сохраняя при этом как можно больше информации. Например,..

Сюжетно спереди назад: точечные диаграммы и пузырьковые диаграммы
Знайте разницу - и сделайте так, чтобы они выглядели потрясающе! Прошло несколько дней с момента моей последней публикации в библиотеке Plotly, причем последняя статья посвящена гистограммам и линейным диаграммам. Хотя я рекомендую прочитать его перед этим, это ни в коем случае не обязательно, поскольку каждая статья написана так, чтобы рассказывать всю историю. Если вы хотите продолжить серию, вот ссылки: 4 причины, по которым я выбираю графику в качестве основной библиотеки..

Применение 7 алгоритмов классификации к набору данных Titanic
В поисках наиболее точного алгоритма! Если вы только начинаете заниматься наукой о данных, проект Титаник: Машинное обучение от катастрофы на Kaggle - один из лучших способов изучить алгоритмы классификации! В этой статье я расскажу, как я применил 7 различных алгоритмов классификации к этому набору данных, и выясним, какой из них дает нам наилучшую точность. Я даже отправил модели на конкурс Kaggle, поэтому мы точно узнаем, как каждая модель работает с неизвестными данными!..

Ускорьте свой исследовательский анализ данных с помощью профилирования Pandas
Исследовательский анализ данных утомителен. Автоматизируйте процесс и создавайте подробные интерактивные отчеты с помощью одной строчки кода с помощью Pandas-Profiling. При запуске нового проекта в области науки о данных первым шагом после получения набора данных в первый раз является его понимание. Мы достигаем этого, выполняя исследовательский анализ данных (EDA). Это включает в себя определение типа данных каждой переменной, распределения целевой переменной, количества различных..

Анализ серии комиксов "Странная планета"
И проблемы построения модели классификации для выбора элемента из списка произвольной длины Для тех, кто не знаком с Strange Planet: Что это? Странная планета - это веб-комикс, созданный Натаном У. Пайлом. Между этими комиксами и его рассказами о голубях, олицетворяющими голубей, он стал одним из моих любимых инстаграмм. В комиксах Пайл публикует сообщения об обычных человеческих взаимодействиях, передавая людей как инопланетных существ. Я потратил время на анализ всех комиксов,..