Публикации по теме 'data-visualization'
Сегментация плотности тайских ресторанов: Python с кластеризацией K-средних
Привет! Я Тунг, и это мои первые рассказы для моего проекта выходного дня. Что вдохновило меня на этот проект, так это то, что я почти два года учился, чтобы стать специалистом по данным, в основном на Youtube, сайтах кодирования и, конечно же, на Medium, но моего обучения недостаточно, мне нужно показать то, что я узнал, поэтому я здесь в Medium, чтобы публиковать мой проект выходного дня раз в неделю.
Отказ от ответственности: код предоставляется в конце рассказа, мне нравится, чтобы..
В любом случае, в чем смысл PCA?
Принцип компонентного анализа (PCA) - одно из модных словечек, которые люди любят произносить в сообществе специалистов по науке о данных. Тем из вас, кто не знаком с PCA, я рекомендую прочитать эту статью о stackexchange . Также этот блог Мэтта Бремса - отличный ресурс для еще более глубокого понимания.
Но на высоком уровне PCA - это метод организации ваших данных таким образом, чтобы ваша информация хранилась в ортогональных (независимых) функциях, которые инкапсулируют как можно..
Визуализация данных — Titanic Data Set
Добро пожаловать в 1-й пост о визуализации данных самого популярного набора данных (PS-Hello World of Data Analytics) — наборы данных Titanic.
Обзор набора данных
Начнем с проверки данных в этих столбцах
Кратко о наборе данных
Как мы видим, 1-й столбец содержит имя путешествующих пассажиров, 2-й — пол. 3-й — самый важный столбец или наш целевой столбец, в котором рассказывается, кому всем повезло пережить аварию. В четвертой колонке указан возраст пассажиров. 6-й..
Как разместить приложение машинного обучения в Google Cloud с помощью Flask и Vue.js.
Итак, потратив часы на обучение, тестирование и валидацию вашей прогнозной модели, пришло время поделиться ее результатами с конечными пользователями.
Иногда это может быть так же просто, как предоставить csv прогнозы, в более сложных случаях вам может потребоваться запускать запланированный скрипт партиями, но иногда ситуация потребует, чтобы вы запускали скрипт из пользовательского интерфейса или из другого приложения. .
В этих, более сложных случаях вам следует рассмотреть..
Визуализация данных
Визуализации - отличный способ показать историю, которую хотят рассказать данные. Однако не все визуализации построены одинаково. Мое практическое правило - придерживаться простых, понятных и хорошо размеченных графиков. Лучше всего всегда работают линейные графики, гистограммы и гистограммы. Наиболее известные библиотеки для визуализации - matplotlib и seaborn. Seaborn построен на основе matplotlib, поэтому сначала стоит взглянуть на matplotlib, но в этой статье мы рассмотрим только..
Данные отвечают на вечный вопрос: «Вы слишком стары, чтобы учиться программированию?»
Использование результатов опроса разработчиков для ответа на три вопроса, связанных с возрастом обучения программированию
«… К тому времени, когда я закончу школу, мне будет пятьдесят? Он улыбнулся. "Тебе все равно будет пятьдесят"
- Эдит Ева Эгер, Выбор: примите возможное
Все мы проходим через разные фазы, когда стремимся заново изобрести себя или начать что-то, что может полностью изменить направление нашей жизни. Естественно, резкое изменение такого масштаба не только..
Разложение по сингулярным значениям и его приложения в анализе главных компонентов
Математический инструмент для надежного расчета PCA
«Изучение всех данных обучения не имеет ничего общего с фактическим обучением. Что вы в основном сделали, так это запомнили данные »
Линейная алгебра составляет основу алгоритмов машинного обучения, начиная от простых линейных регрессий и заканчивая глубокими нейронными сетями. Основная причина этого в том, что набор данных может быть представлен с помощью двухмерной матрицы, в которой столбец представляет функции, а строка..