Публикации по теме 'data-visualization'
Создание интригующих визуализаций
Чтобы по-настоящему понять все тонкости наших данных, важно построить несколько предварительных графиков. Как группа мы решили, что наиболее эффективными инструментами в Python для выполнения этой задачи являются как matplotlib , так и seaborn . Мы хотели увидеть, насколько разные. Оба этих инструмента эффективно визуализируют наш набор данных, показывая, сколько лесных пожаров происходит в каждом штате и насколько велики эти лесные пожары в среднем в каждом штате. Мы смогли найти..
Классификация грибов: логистическая регрессия против кластеризации K-среднего
Недавно я наткнулся на набор данных на Kaggle под названием Классификация грибов , который вы можете найти здесь . И это полностью привлекло мое внимание мыслью о том, как предки судили о грибах, просто взглянув на них. Что ж, тогда я не мог им помочь, но теперь сценарий другой!
Давайте посмотрим, какие особенности означают верную смерть, а какие наиболее приятны в этом наборе данных о характеристиках грибов. И насколько уверенной может быть наша модель? (Скрестив пальцы!)
Что..
Не отбрасывайте распределение: важность вероятностных распределений
Поскольку наука о данных становится ключевым фактором в процессе принятия решений в обществе, вместе с этим происходит демократизация анализа данных, позволяющая любому, а не только статистикам, делать выводы из данных. Существует несомненная легкость сводной статистики, которая делает их привлекательными, но здесь, в Fulcrum, мы часто сталкиваемся с клиентами, которые выбрасывают распределения в своих упражнениях по науке о данных, что создает риск для их организаций.
Давайте..
Разберите проблему
Как мы видели здесь и здесь , после определения проблемы/цели — наш следующий шаг в качестве аналитика данных — разделить проблему на более мелкие, управляемые, решаемые части (разобрать).
Часто ваша проблема будет расплывчатой, например: «Как нам увеличить продажи?». Лучший подход к решению этих больших проблем — это решение более мелких проблем, которые вы проанализировали из большой проблемы. Например
Как мы увеличиваем продажи? можно разделить на
Чего хотят от нас наши..
Pandas Полное руководство (Часть 6)
В этом руководстве мы рассмотрим переименование и объединение.
Часто к нам приходят данные с именами столбцов, индексами или другими соглашениями об именах, которые нас не удовлетворяют. В этом случае вы узнаете, как использовать функции pandas, чтобы изменить имена оскорбительных записей на что-то лучшее.
Вы также узнаете, как объединять данные из нескольких фреймов данных и/или рядов.
Переименование:
Первая функция, о которой мы поговорим, — это функция переименования, которая..
Машинное обучение | Линейная регрессия
Линейная регрессия | Машинное обучение
Алгоритм линейной регрессии применяется к задаче контролируемого обучения. Контролируемое обучение - это обучение модели на помеченном наборе данных. Помеченный набор данных - это набор, который имеет как входные, так и выходные параметры.
Модели регрессии определяют значение прогноза на основе независимых переменных. Модель регрессии исследует взаимосвязь между зависимой переменной (выход) и независимыми переменными (входные данные)...
Понимание «радиолокационного графика»
Радарная диаграмма (паутинообразная диаграмма, звездная диаграмма, веб-диаграмма, неправильный многоугольник) — это графический метод , используемый для отображения многомерных данных на двумерной диаграмме , состоящей из 3 или больше количественных переменных. Переменные представлены в виде последовательности равноугольных спиц (также известных как радиусы/оси), начинающихся с общей центральной точки. Взаимное положение осей и угол между осями неинформативны.
Каждый радиус..