Публикации по теме 'data-visualization'
Цветовые шкалы - это все в визуализации данных - правильно ли вы их используете?
Как выбор правильного цвета и масштабов может сделать или сломать ваше сообщение (с примерами и кодом Python)
Возможно, вы видели эту карту COVID , о которой сначала сообщил andishenouraee в Твиттере, а затем она была освещена в средствах массовой информации.
Даже если да, взгляните еще раз. Если нет, то это картограммы, на которых показаны случаи заболевания Covid-19 в каждом округе (с июля 2020 года) в штате Джорджия. Две карты кажутся очень похожими, но наблюдатели среди вас могли..
Линейный дискриминантный анализ Фишера в Python с нуля
Линейный дискриминантный анализ Фишера (LDA) - это алгоритм уменьшения размерности, который также можно использовать для классификации. В этом сообщении блога мы узнаем больше о LDA Fisher и реализуем его с нуля на Python.
LDA?
Линейный дискриминантный анализ (LDA) - это метод уменьшения размерности. Как следует из названия, методы уменьшения размерности сокращают количество измерений (то есть переменных) в наборе данных, сохраняя при этом как можно больше информации. Например,..
Сюжетно спереди назад: точечные диаграммы и пузырьковые диаграммы
Знайте разницу - и сделайте так, чтобы они выглядели потрясающе!
Прошло несколько дней с момента моей последней публикации в библиотеке Plotly, причем последняя статья посвящена гистограммам и линейным диаграммам. Хотя я рекомендую прочитать его перед этим, это ни в коем случае не обязательно, поскольку каждая статья написана так, чтобы рассказывать всю историю.
Если вы хотите продолжить серию, вот ссылки:
4 причины, по которым я выбираю графику в качестве основной библиотеки..
Применение 7 алгоритмов классификации к набору данных Titanic
В поисках наиболее точного алгоритма!
Если вы только начинаете заниматься наукой о данных, проект Титаник: Машинное обучение от катастрофы на Kaggle - один из лучших способов изучить алгоритмы классификации! В этой статье я расскажу, как я применил 7 различных алгоритмов классификации к этому набору данных, и выясним, какой из них дает нам наилучшую точность.
Я даже отправил модели на конкурс Kaggle, поэтому мы точно узнаем, как каждая модель работает с неизвестными данными!..
Ускорьте свой исследовательский анализ данных с помощью профилирования Pandas
Исследовательский анализ данных утомителен. Автоматизируйте процесс и создавайте подробные интерактивные отчеты с помощью одной строчки кода с помощью Pandas-Profiling.
При запуске нового проекта в области науки о данных первым шагом после получения набора данных в первый раз является его понимание. Мы достигаем этого, выполняя исследовательский анализ данных (EDA). Это включает в себя определение типа данных каждой переменной, распределения целевой переменной, количества различных..
Анализ серии комиксов "Странная планета"
И проблемы построения модели классификации для выбора элемента из списка произвольной длины
Для тех, кто не знаком с Strange Planet:
Что это?
Странная планета - это веб-комикс, созданный Натаном У. Пайлом. Между этими комиксами и его рассказами о голубях, олицетворяющими голубей, он стал одним из моих любимых инстаграмм. В комиксах Пайл публикует сообщения об обычных человеческих взаимодействиях, передавая людей как инопланетных существ.
Я потратил время на анализ всех комиксов,..