Публикации по теме 'data-visualization'


Создание интригующих визуализаций
Чтобы по-настоящему понять все тонкости наших данных, важно построить несколько предварительных графиков. Как группа мы решили, что наиболее эффективными инструментами в Python для выполнения этой задачи являются как matplotlib , так и seaborn . Мы хотели увидеть, насколько разные. Оба этих инструмента эффективно визуализируют наш набор данных, показывая, сколько лесных пожаров происходит в каждом штате и насколько велики эти лесные пожары в среднем в каждом штате. Мы смогли найти..

Классификация грибов: логистическая регрессия против кластеризации K-среднего
Недавно я наткнулся на набор данных на Kaggle под названием Классификация грибов , который вы можете найти здесь . И это полностью привлекло мое внимание мыслью о том, как предки судили о грибах, просто взглянув на них. Что ж, тогда я не мог им помочь, но теперь сценарий другой! Давайте посмотрим, какие особенности означают верную смерть, а какие наиболее приятны в этом наборе данных о характеристиках грибов. И насколько уверенной может быть наша модель? (Скрестив пальцы!) Что..

Не отбрасывайте распределение: важность вероятностных распределений
Поскольку наука о данных становится ключевым фактором в процессе принятия решений в обществе, вместе с этим происходит демократизация анализа данных, позволяющая любому, а не только статистикам, делать выводы из данных. Существует несомненная легкость сводной статистики, которая делает их привлекательными, но здесь, в Fulcrum, мы часто сталкиваемся с клиентами, которые выбрасывают распределения в своих упражнениях по науке о данных, что создает риск для их организаций. Давайте..

Разберите проблему
Как мы видели здесь и здесь , после определения проблемы/цели — наш следующий шаг в качестве аналитика данных — разделить проблему на более мелкие, управляемые, решаемые части (разобрать). Часто ваша проблема будет расплывчатой, например: «Как нам увеличить продажи?». Лучший подход к решению этих больших проблем — это решение более мелких проблем, которые вы проанализировали из большой проблемы. Например Как мы увеличиваем продажи? можно разделить на Чего хотят от нас наши..

Pandas Полное руководство (Часть 6)
В этом руководстве мы рассмотрим переименование и объединение. Часто к нам приходят данные с именами столбцов, индексами или другими соглашениями об именах, которые нас не удовлетворяют. В этом случае вы узнаете, как использовать функции pandas, чтобы изменить имена оскорбительных записей на что-то лучшее. Вы также узнаете, как объединять данные из нескольких фреймов данных и/или рядов. Переименование: Первая функция, о которой мы поговорим, — это функция переименования, которая..

Машинное обучение | Линейная регрессия
Линейная регрессия | Машинное обучение Алгоритм линейной регрессии применяется к задаче контролируемого обучения. Контролируемое обучение - это обучение модели на помеченном наборе данных. Помеченный набор данных - это набор, который имеет как входные, так и выходные параметры. Модели регрессии определяют значение прогноза на основе независимых переменных. Модель регрессии исследует взаимосвязь между зависимой переменной (выход) и независимыми переменными (входные данные)...

Понимание «радиолокационного графика»
Радарная диаграмма (паутинообразная диаграмма, звездная диаграмма, веб-диаграмма, неправильный многоугольник) — это графический метод , используемый для отображения многомерных данных на двумерной диаграмме , состоящей из 3 или больше количественных переменных. Переменные представлены в виде последовательности равноугольных спиц (также известных как радиусы/оси), начинающихся с общей центральной точки. Взаимное положение осей и угол между осями неинформативны. Каждый радиус..