Публикации по теме 'exploratory-data-analysis'


Представляем Data Detective: изучение пяти основополагающих столпов науки о данных
Введение В мире науки о данных и аналитики раскрытие скрытых идей в огромном количестве данных сродни раскрытию сложного дела в роли детектива. Точно так же, как опытному детективу нужен набор навыков и инструментов для анализа улик и раскрытия правды, ученые и аналитики данных полагаются на пять основных столпов, которые составляют основу их работы. Эти столпы — статистика, обработка и очистка данных, исследовательский анализ данных (EDA), машинное обучение и визуализация данных..

Анализ главных компонентов (PCA) — Давайте разберем!
Оглавление: Пример, где нам нужен PCA Как PCA помогает в конвейере машинного обучения. Как работает PCA — Геометрическая интуиция Математика PCA Заключение Вопрос: Есть ли методы лучше, чем PCA? Предварительные условия Собственные значения и собственные векторы Линейная алгебра #1. Пример, когда нам нужен PCA Начнем с примера. «Набор данных D = набор пары xi и yi в диапазоне от 1 до n, так что значение xi принадлежит действительным числам, а yi..

Аналитика на платформе OTT
Автор: Анишвар Аммаяппан (LatentView Analytics) Объем мирового рынка OTT в 2019 году оценивался в 121,61 миллиарда долларов и, по прогнозам, к 2027 году достигнет 1 039,03 миллиарда долларов, при этом в период с 2020 по 2026 год среднегодовой темп роста составит 29,4%. Северная Америка доминировала в общей доле рынка OTT в 2019 году, так как регион является оснащен высокоскоростным широкополосным доступом и новыми услугами, такими как AT&T и ESPN. Тем не менее, ожидается, что..

Краткое введение в очистку данных
Очистка данных — это процесс исправления или удаления неверных, поврежденных, неправильно отформатированных, дублирующихся или неполных данных в наборе данных. Очистка данных является важным шагом в построении модели машинного обучения, поскольку она гарантирует, что данные, используемые для обучения модели, являются точными, полными, непротиворечивыми и актуальными. Очистка данных имеет несколько преимуществ при построении модели машинного обучения. Некоторые из них, Повышает..

Как выполнить исследовательский анализ данных (EDA) и очистить данные для обучения модели?
EDA или исследовательский анализ данных — это основной шаг для решения любой задачи машинного обучения, когда у вас есть данные в текстовом формате, например в формате .csv или .xlxs, или, возможно, даже когда вы извлекаете такие данные из SQL или Базы данных NoSQL. Чтобы понять суть данных, мы должны провести исследовательский анализ данных, чтобы продвинуться вперед в любом проекте машинного обучения, прежде чем обучать модель. Чтобы понять это, мы возьмем постановку задачи, где я..

Предиктор Рихтера: моделирование ущерба от землетрясения
Использование науки о данных для моделирования серьезности повреждений зданий после землетрясения Использование науки о данных для решения проблем с идентификацией и решения бизнес-задач в современном мире невозможно переоценить. Из проблем, связанных с социальными, медицинскими и экологическими проблемами и т. Д., Наука о данных может помочь определить серьезность этих проблем и их воздействие и предоставить возможные решения для их решения. Одним из многих вопросов, который в..

Сквозной проект машинного обучения, предсказывающий победителя игры League of Legends
Введение League of Legends — популярная многопользовательская онлайновая боевая арена (MOBA), в которой две команды игроков соревнуются друг с другом, чтобы уничтожить базу вражеской команды. С миллионами игроков по всему миру League of Legends стала глобальным явлением, а профессиональные лиги и турниры предлагают победителям значительные призы. В этой статье мы рассмотрим процесс построения модели машинного обучения для прогнозирования победителя игры League of Legends (LoL). Мы..