Публикации по теме 'data-visualization'


t-SNE (встраивание стохастического соседа с t-распределением)
Что такое т-СНЭ? t-SNE — это метод машинного обучения для уменьшения размерности, который помогает вам идентифицировать соответствующие шаблоны. Основным преимуществом t-SNE является способность сохранять локальную структуру. Это означает, грубо говоря, что точки, которые находятся близко друг к другу в многомерном наборе данных, будут иметь тенденцию быть близкими друг к другу на диаграмме. Алгоритм t-SNE моделирует распределение вероятностей соседей вокруг каждой точки. Здесь..

Прогнозирование оттока клиентов в телекоммуникациях
Введение «СириТел» — телекоммуникационная компания, стремящаяся прогнозировать и предотвращать отток клиентов. Отток клиентов — это процент клиентов, которые перестали использовать продукт или услугу компании в течение определенного периода времени. Это может быть серьезной проблемой, поскольку влияет на лояльность клиентов компании и, в конечном итоге, влияет на доходы компании. Чтобы помочь SiriTel решить проблему оттока клиентов, я провел исследовательский анализ данных, а затем..

Bqplot: расширение возможностей двухмерной визуализации на основе Python ✊
Что такое Bqplot? Пример визуализации данных с помощью библиотеки Bqplot. Введение в пакет Bqplot в Python с примерами. Bqplot — это библиотека для построения графиков Python, основанная на интерактивной библиотеке визуализации Plotly. Он предоставляет высокоуровневый API для создания интерактивных и настраиваемых визуализаций в блокнотах и ​​веб-приложениях Jupyter. Bqplot позволяет нам создавать богатые и интерактивные визуализации с помощью библиотеки Plotly.js. Bqplot..

Ваша карта плотности населения Швейцарии.
Эта статья вдохновлена ​​прекрасным многосерийным учебником Картография из командной строки , написанным Майком Бостоком , и увлечением картами. Я настоятельно рекомендую прочитать все четыре статьи учебника. После того, как я просмотрел статьи и создал карту Техаса, я решил сделать карту Швейцарии, так как данные о ее границах легко найти в Интернете. Итак, эта статья о том, как я построил карту плотности населения Швейцарии. Сначала установите необходимые пакеты npm (у вас уже..

5 пакетов Python, которые должен знать каждый начинающий специалист по данным
Привет, мир! Наука о данных — это междисциплинарная область, которая включает в себя извлечение идей и знаний из данных. Чтобы стать специалистом по данным, вы должны владеть различными языками программирования, статистическим анализом и визуализацией данных. Одним из самых популярных языков программирования для обработки данных является Python . В этой статье мы рассмотрим основные пакеты, которые вам нужно знать, чтобы стать специалистом по данным в Python. 1. НумПи:..

7 пакетов R, которые вы должны использовать для визуализации данных
С примером кода и бесплатными наборами данных Введение Дело не в том, что ты делаешь, а в том, как ты это делаешь . ― Чери Хубер, Страдания необязательны: три ключа к свободе и радости Наличие данных, но незнание того, как их визуализировать, — это то, что я называю причинением себе страданий. Итак, как сказала Чери, есть 3 ключа к свободе и радости — моя точка зрения — данные + R + эти 7 пакетов R. Данные Вы можете следовать моему коду, используя наборы данных,..

Количественная оценка совершенства: демистификация метрик кластеризации в машинном обучении и искусственном интеллекте; Концепция машинного обучения 85
📈🔬 Метрики, используемые для кластеризации: изучение индекса Данна в машинном обучении 🌐 🤔 Когда дело доходит до классификации и регрессии, у нас есть хорошо известные показатели производительности, такие как AUC, R-квадрат, точность и полнота. Но знаете ли вы, что алгоритмы кластеризации также имеют собственный набор показателей производительности? Сегодня мы углубимся в одну из таких метрик, называемую индексом Данна, которая играет решающую роль в оценке результатов кластеризации...