Публикации по теме 'data-visualization'


Мой план обучения после буткемпинга
Строим свой собственный мост от студента к профессионалу Ранее в этом году я прошел очный онлайн-курс по науке о данных Flatiron School. Программа занимала около 40 часов в неделю в течение 5 месяцев и охватывала практически все, что я ожидал от учебного курса по науке о данных (плюс некоторые вещи, о которых я даже не слышал до того, как начал!). Конечно, невозможно, чтобы какой-либо учебный курс охватил все , что нужно знать специалисту по данным, и дело даже не в этом...

Битва при Хороплетах — Часть 3 — Фолиум
ПИТОН. НАУКА ДАННЫХ. ГЕОВИЗУАЛИЗАЦИЯ Битва при Хороплетах — Часть 3 — Фолиум Использование пакета Folium для создания потрясающих хороплетов В последних двух статьях этой серии мы смогли создать хороплеты из пакетов Geopandas и Altair. Давайте продолжим наше обучение, но на этот раз воспользуемся пакетом folium. ПАКЕТ ФОЛИУМ В этой статье мы представили пакет folium, а также преимущества и недостатки пакета. Как мы увидим позже, folium предоставляет множество инструментов..

Прогнозирование цен на жилье - анализ случайных лесов
Будучи новичком в мире науки о данных, я подумал, что это будет хороший проект для реализации всего машинного обучения, которому я уже научился. Прогнозирование цен на жилье - это соревнование Kaggle для новичков в области науки о данных, которое позволяет экспериментировать с проектированием функций и построением моделей. Моя модель получила RMSE (среднеквадратическую ошибку) около 0,1274 с точностью ~ 90%. В этом посте мы узнаем: Интерпретация случайных лесов Настройка параметров..

Что такое проверка модели.
В машинном обучении под валидацией модели подразумевается процедура, при которой обученная модель оценивается с помощью набора данных тестирования. Набор данных тестирования - это другой бит аналогичного набора данных, из которого выводится обучающий набор. Основная причина использования набора данных тестирования - это проверка предполагаемой способности подготовленной модели. Проверка модели выполняется после обучения модели. Наряду с обучением модели, проверка модели направлена..

Визуализация данных с D3.js для начинающих
Начало работы с визуализацией данных с помощью D3.js Вы когда-нибудь заходили на переполненный стадион или на музыкальное шоу и пытались угадать, сколько людей вас окружало? Вы были далеко? Анализ больших объемов данных может быть непосильной задачей. Но если вы возьмете абстрактные точки данных и преобразуете их в точную и крупную визуальную информацию, вы сможете увидеть вещи аналитически. Это эпоха информации, когда данных более чем достаточно, но лишь немногие знают, что с ними..

HiPlot: интерактивный инструмент визуализации от Facebook
Очень удобный инструмент для исследовательского анализа данных Методы визуализации данных очень полезны для изучения набора данных. В экосистеме науки о данных используется широкий спектр типов визуализации. Что лучше всего подходит для данной задачи, зависит от характеристик данных и переменных. В этой статье мы рассмотрим интерактивный инструмент визуализации, созданный Facebook. По сути, это график с параллельными координатами. Таким образом, каждая строка (то есть точка..

Отслеживайте в реальном времени положение Международной космической станции и людей в космосе — с помощью Python
Отслеживайте положение Международной космической станции и людей в космосе в режиме реального времени — с помощью Python Это очень простая, но мощная программа на Python для отслеживания положения МКС в реальном времени. Мой сын запускал его каждые 30-40 минут, чтобы увидеть его положение :-) Требования: python , IDE, установка нескольких пакетов — pandas, plotly, google. Справка: мы собираемся использовать существующий API для получения местоположения и другой информации в..