Цель позади этого

ПРИВЕТ, ДОБРОЕ УТРО, это пратик корат

  1. Что такое набор метеорологических данных?

Наблюдения Метеорологические данныеданные, состоящие из физических параметров, которые измеряются непосредственно приборами и включают температуру, точку росы, направление ветра, скорость ветра, облачный покров, облачный слой(я). ), высота потолка, видимость, текущая погода и количество осадков.

В Интернете и за последнее время очень удобно получать набор данных о погоде в Интернете для анализа данных и прогнозирования текущих данных, чтобы получить новый прогноз погоды в ближайшие дни, и поблагодарить других за открытый доступ к этому набору данных. вот ссылка на данный набор данных



  1. Чтение нашего набора данных

Прежде всего, давайте опишем наш набор данных. Проверьте погоду, присутствует ли нулевое значение или нет. И проанализируйте, является ли тип данных столбца идеальным или нет.

Глядя на приведенную выше информацию, мы можем получить представление о нашем столбце функций, например, о том, какой тип данных у нас есть, или есть ли какое-либо нулевое значение или нет, если оно есть, нам нужно удалить это значение, и после этого мы получим чистые данные, которые мы увидим в следующей части.

Теперь у нас есть чистые данные, и мы можем перейти к следующей части.

Прежде чем перейти к визуализации, мне нужно преобразовать форматированную дату в тип даты. то после визуализации можно в лучшую сторону.

2. Визуализация данных

Поскольку мы передискретизировали наши данные в ежемесячной основе из почасовой, и снова я передискретизировал их до года и взял среднее значение за годы

Мы добавили два дополнительных столбца в наш набор данных для простоты визуализации данных.

  1. Линейный график наших данных временного ряда

с помощью этой визуализации мы узнаем характер набора данных, растет ли он линейно или экспоненциально, поэтому для набора данных временных рядов эту визуализацию всегда необходимо выполнять.

запустив приведенный выше код, мы получим график, показанный ниже.

Это показывает очень хорошее поведение нашего набора данных и дает нам подсказку о том, как данные меняются из года в год.

2) График бара

Гистограмма или столбчатая диаграмма — это диаграмма или график, который представляет категориальные данные в виде прямоугольных столбцов с высотой или длиной, пропорциональными значениям, которые они представляют. Полосы могут располагаться вертикально или горизонтально. Вертикальную гистограмму иногда называют столбчатой ​​диаграммой.

мы будем отображать наши данные в виде гистограммы, чтобы получить больше информации о наших данных

это даст нам такой результат и для всех функций, доступных в нашем наборе данных.

3) Карта корреляции

Матрица корреляции — это просто таблица, отображающая корреляцию. Меру лучше всего использовать в переменных, которые демонстрируют линейную зависимость друг от друга.

это даст нам отношение или влияние всех переменных друг на друга

здесь полный белый цвет показывает нам отсутствие связи, а розоватый цвет показывает нам, что переменные положительно коррелируют друг с другом, а голубоватый цвет дает нам намек на отрицательно коррелированные значения

это один из лучших способов выяснить корреляцию между переменной, чтобы использовать многие алгоритмы классификации, такие как логистическая регрессия.

Заключение

Визуализация данных дает нам очень информативные вещи, такие как поведение наших данных, здесь мы можем видеть, что каждая функция линейно растет и больше не имеет для этого значения. поэтому визуализация является одной из наиболее важных частей анализа данных.

GithHub Ссылка с описанием: Анализ метеорологических данных

Я благодарен наставникам из Suvenconsultants за то, что они предоставили потрясающие формулировки проблем и дали многим из нас возможность пройти стажировку по программированию. Спасибо Suvenconsultants.