Публикации по теме 'data-analytics'


Публикация в блоге по науке о данных —  Набор данных о диабете
Введение Этот проект представляет собой запись в блоге программы Data Scientist Nano Degree от Udacity. Я предпочитаю работать с набором данных о диабете с веб-сайта Kaggle. Этот набор данных содержит несколько медицинских предикторов (независимых) переменных и одну целевую (зависимую) переменную, Исход. Независимые переменные включают количество беременностей, которые были у пациентки, их ИМТ, уровень инсулина, возраст и так далее. У меня есть несколько вопросов, связанных с..

Оценка сделки. Часть 1. Предварительная обработка данных в MySQL
Оценка сделки. Часть 1. Предварительная обработка данных в MySQL В моем последнем блоге я писал об ИИ и продажах ; сегодня я начну процесс аналитики данных о продажах . Я буду строить модель логистической регрессии , чтобы присвоить оценку каждой из потенциальных клиентов, которую компания может использовать для определения потенциальных сделок. Более высокий балл будет означать, что сделка горячая, т. е. с наибольшей вероятностью будет конвертирована, тогда как более низкий..

Понимание описательной статистики
Пытайте данные, и они во всем признаются – Рональд Коуз Введение в описательную статистику Прежде чем перейти к пониманию описательной статистики. давайте сначала попробуем понять статистику. Определить статистику . Статистика — это раздел математики, собирающий, систематизирующий и описывающий данные. Типы статистики: 1. Описательная статистика 2. Логическая статистика В этом блоге мы будем разбираться в описательной статистике, а в следующих блогах будем изучать..

Влияние науки о данных на бизнес-стратегию
И. Введение Наука о данных приобрела огромное значение в современной бизнес-стратегии. Это относится к процессу использования расширенной аналитики и методов машинного обучения для извлечения информации и знаний из больших наборов данных. Учитывая экспоненциальный рост данных, компаниям стало необходимо использовать науку о данных для принятия решений и оптимизации операций. В этой статье мы углубимся в то, как наука о данных меняет подход компаний к бизнес-стратегии. Мы..

Выявление и удаление выбросов
Выбросы — это значения, которые значительно выделяются из остального набора данных. Для достижения точности в нашей модели машинного обучения крайне важно идентифицировать такие значения и работать с ними. Выбросы нарушают обобщение данных, что влияет на прогноз модели, особенно когда мы имеем дело с небольшими наборами данных. Выявить выбросы сложно, поскольку это противоречит изменчивости набора данных, а наличие слишком большого количества выбросов просто означает, что набор данных..

Что является хорошей практикой для дизайна приборной панели?
Создание панели мониторинга кажется простым благодаря концепции перетаскивания Power BI или Tableau. Однако многие информационные панели были созданы, но не использовались, потому что они не могут служить целям пользователей или слишком сложны для понимания. В этой статье я расскажу о передовых методах проектирования информационных панелей, начиная с концепции ориентированного на пользователя дизайна и заканчивая организацией визуализации. Содержание этой статьи Кто такие..

Технология AI/ML, используемая для борьбы с системным расизмом
Написано Оливией Клейман, аналитиком по маркетингу и корпоративным коммуникациям компании Systech Хотя применение технологий AI/ML кажется бесконечным, эти технологические предложения часто критикуют за склонность к предвзятости. Подтверждение, оставшийся в живых и предвзятость поиска — все это наглядные примеры того, как данные могут быть непреднамеренно использованы для формирования повествования, которое не является точным представлением реальности. Однако недавние события..