Публикации по теме 'data-visualization'


Правильная обработка выбросов для улучшения сценариев переобучения
Посмотрите, как квантильная обработка выбросов может повысить точность модели Основной подход машинного обучения состоит в разделении данных на наборы для обучения и тестирования. Затем алгоритмы машинного обучения обучаются на обучающем наборе (наборе данных) для обобщения от шаблона до невидимых данных, то есть тестового набора. Когда алгоритму не удается обобщить то, что он узнал из обучающего набора, на тестовый набор, это означает, что алгоритм переобучается. Переобучение —..

Самые распространенные библиотеки Python для визуализации данных
Визуализация данных важна, потому что она помогает нам понимать сложные данные, эффективно передавать информацию, улучшать процесс принятия решений, предоставлять информацию и экономить время. Мы рассмотрим библиотеки визуализации данных Python, которые можно использовать в различных областях. Это библиотеки Matplotlib, Seaborn, Plotnine, Bokeh, Pygal, Plotly, geoplotlib,missno, Altair, Pydeck и Folium. Некоторые библиотеки поддерживают интерактивные графики. Некоторые из них..

RAPIDS до .11
Больше скорости, масштабируемости и надежности Поскольку 2019 год подходит к концу, команда RAPIDS не могла закончить год без последнего релиза. Выпуск 0.11 не только готовит нас к 2020 году, но и следует теме предыдущих выпусков, делая сквозную обработку данных на графических процессорах более быстрой, надежной и масштабируемой. Учитывая, что это последний блог в году, я бы обычно делал резюме, но Юбилейный блог 0.10 и Благодарственный блог с благодарностью уже сделали это...

Создайте диаграмму с накоплением с помощью JavaScript
Узнайте, что такое диаграмма с накоплением и как легко создавать диаграммы с накоплением различных типов с помощью JS с визуализацией количества медалей в Пекине-2022. Визуализация данных — навык, жизненно необходимый аналитикам и разработчикам в наше время. Диаграммы с накоплением — один из наиболее широко используемых типов диаграмм, и теперь я хочу рассказать вам, что это такое и как с легкостью построить такую ​​графику с помощью JavaScript. В основной учебной части я буду..

Ускорение TSNE с помощью графических процессоров: от часов до секунд
TSNE (T-Distributed Stochastic Neighbor Embedding) - популярный алгоритм уменьшения размерности без учителя, который находит такие разнообразные применения, как неврология , сходство изображений и визуализация нейронных сетей . К сожалению, его самым большим недостатком было долгое время обработки в большинстве доступных реализаций. RAPIDS теперь обеспечивает быстрое ускорение TSNE с помощью графического процессора, основанное на подходе Barnes-Hut на основе графического..

Мастер-класс по анализу выбросов
Что такое аутсайдер?? Мы должны определить, что такое выброс, прежде чем продолжить статью. Выбросы — это любые наблюдения, которые выделяются среди остальных точек данных и называются таковыми. Они, как правило, влияют на распределение данных. Иногда их удаляют, хотя это не всегда лучшая практика, и иногда стоит взглянуть на эти точки, потому что они могут предоставить значимую информацию. Набор данных, использованный в этой статье, представляет собой результаты экзаменов учащихся..

Незабываемые 15: Изучение лучших визуализаций данных всех времен (2023)
Данные прекрасны — они могут вдохновлять, улучшать жизнь и выявлять лучшее в людях. Привет! Меня зовут Гейб, и я увлечен обучением других Python и машинному обучению. Но сегодня я хочу поделиться еще одним аспектом своего опыта, который приносит мне огромную радость, — анализом и визуализацией данных. Имея более чем десятилетний опыт работы в этой области, я стал свидетелем способности превращать необработанные данные в красивые и информативные визуализации. Это похоже на..