Публикации по теме 'data-visualization'


Сегментация плотности тайских ресторанов: Python с кластеризацией K-средних
Привет! Я Тунг, и это мои первые рассказы для моего проекта выходного дня. Что вдохновило меня на этот проект, так это то, что я почти два года учился, чтобы стать специалистом по данным, в основном на Youtube, сайтах кодирования и, конечно же, на Medium, но моего обучения недостаточно, мне нужно показать то, что я узнал, поэтому я здесь в Medium, чтобы публиковать мой проект выходного дня раз в неделю. Отказ от ответственности: код предоставляется в конце рассказа, мне нравится, чтобы..

В любом случае, в чем смысл PCA?
Принцип компонентного анализа (PCA) - одно из модных словечек, которые люди любят произносить в сообществе специалистов по науке о данных. Тем из вас, кто не знаком с PCA, я рекомендую прочитать эту статью о stackexchange . Также этот блог Мэтта Бремса - отличный ресурс для еще более глубокого понимания. Но на высоком уровне PCA - это метод организации ваших данных таким образом, чтобы ваша информация хранилась в ортогональных (независимых) функциях, которые инкапсулируют как можно..

Визуализация данных — Titanic Data Set
Добро пожаловать в 1-й пост о визуализации данных самого популярного набора данных (PS-Hello World of Data Analytics) — наборы данных Titanic. Обзор набора данных Начнем с проверки данных в этих столбцах Кратко о наборе данных Как мы видим, 1-й столбец содержит имя путешествующих пассажиров, 2-й — пол. 3-й — самый важный столбец или наш целевой столбец, в котором рассказывается, кому всем повезло пережить аварию. В четвертой колонке указан возраст пассажиров. 6-й..

Как разместить приложение машинного обучения в Google Cloud с помощью Flask и Vue.js.
Итак, потратив часы на обучение, тестирование и валидацию вашей прогнозной модели, пришло время поделиться ее результатами с конечными пользователями. Иногда это может быть так же просто, как предоставить csv прогнозы, в более сложных случаях вам может потребоваться запускать запланированный скрипт партиями, но иногда ситуация потребует, чтобы вы запускали скрипт из пользовательского интерфейса или из другого приложения. . В этих, более сложных случаях вам следует рассмотреть..

Визуализация данных
Визуализации - отличный способ показать историю, которую хотят рассказать данные. Однако не все визуализации построены одинаково. Мое практическое правило - придерживаться простых, понятных и хорошо размеченных графиков. Лучше всего всегда работают линейные графики, гистограммы и гистограммы. Наиболее известные библиотеки для визуализации - matplotlib и seaborn. Seaborn построен на основе matplotlib, поэтому сначала стоит взглянуть на matplotlib, но в этой статье мы рассмотрим только..

Данные отвечают на вечный вопрос: «Вы слишком стары, чтобы учиться программированию?»
Использование результатов опроса разработчиков для ответа на три вопроса, связанных с возрастом обучения программированию «… К тому времени, когда я закончу школу, мне будет пятьдесят? Он улыбнулся. "Тебе все равно будет пятьдесят" - Эдит Ева Эгер, Выбор: примите возможное Все мы проходим через разные фазы, когда стремимся заново изобрести себя или начать что-то, что может полностью изменить направление нашей жизни. Естественно, резкое изменение такого масштаба не только..

Разложение по сингулярным значениям и его приложения в анализе главных компонентов
Математический инструмент для надежного расчета PCA «Изучение всех данных обучения не имеет ничего общего с фактическим обучением. Что вы в основном сделали, так это запомнили данные » Линейная алгебра составляет основу алгоритмов машинного обучения, начиная от простых линейных регрессий и заканчивая глубокими нейронными сетями. Основная причина этого в том, что набор данных может быть представлен с помощью двухмерной матрицы, в которой столбец представляет функции, а строка..