Набор данных о погоде в Сегеде состоит из данных о почасовых / суточных сводках с температурой, давлением и т. Д. В Сегеде, Венгрия. Цель состоит в том, чтобы предсказать кажущуюся температуру для заданных входных данных. этот набор данных доступен в kaggle.

в этом наборе данных 17 столбцов.

Форматированная дата »,« Сводка »,« Тип осадков »,« Температура © »,« Видимая температура © »,« Влажность »,« Скорость ветра (км / ч) »,« Пеленг ветра (градусы) »,« Видимость (км) ) ',' Громкое прикрытие ',' Давление (миллибары) ',' Сводка за день '

Сначала мы проверим, есть ли какие-либо нулевые значения. и удалите их.

здесь мы видим, что столбец «Тип осадков» имеет нулевые значения. поэтому мы удалим этот столбец.

Затем мы визуализируем данные с помощью блочной диаграммы для дальнейшего анализа значений.

здесь мы видим, что есть выбросы, которые нужно обработать. поэтому мы будем использовать метод межквартильного диапазона (IQR) для обработки этих выбросов. мы обрабатываем только выбросы в столбцах «Влажность» и «Давление (миллибары)», потому что другие значения распределяются нормально.

Далее мы взглянем на гистограммы наших данных.

после этого мы используем стандартный масштабатор для масштабирования нашего набора данных до стандартного набора значений.

мы будем использовать корреляционную матрицу, чтобы проверить корреляцию между столбцами.

следовательно, это линейная модель, и в ней используется связь между столбцами, которые мы используем для анализа главных компонентов (PCA), чтобы уменьшить количество столбцов для лучшего обучения модели лайнера.

здесь мы видим, что 7 столбцов сократились до трех столбцов.

теперь мы будем использовать эти 3 столбца для обучения модели линейной регрессии.

мы будем использовать разделение на обучение и тестирование с тестом 20% для обучения и тестирования нашей модели.

после обучения мы можем получить значения среднеквадратичной ошибки как

и r2 оценивается как

коэффициент и пересечение нашей линейной модели.

оценка нашей линейной модели.

визуализация модели 2D

визуализация модели 3D