Публикации по теме 'data-analytics'


Как пережить Рождество в роли специалиста по данным
10 дел, которые стоит выполнить в праздничный сезон Мы стремительно приближаемся к новому году. Но прежде у нас есть несколько дней для отдыха во время наступающего курортного сезона. Честно говоря, я всегда рада, когда мне нужно выполнить какие-то дела после второго дня вместе со всей семьей. А анализ данных и кодирование - это всегда отличная задача, чтобы исчезнуть. Так. Прежде чем приступить к выполнению новогоднего решения, вот несколько предложений о том, как провести..

Простая математика, лежащая в основе анализа главных компонентов с использованием Numpy
Как мы все знаем, машинное обучение в основном делится на 3 типа: Контролируемое обучение Неконтролируемое обучение Обучение с подкреплением Итак, что такое PCA на самом деле? Анализ главных компонентов (PCA) относится к категории неконтролируемого обучения. PCA можно использовать в больших наборах данных, которые содержат множество функций , что затрудняет интерпретацию и анализ набора данных специалистам по обработке данных. PCA используется для уменьшения размерности..

День 9: Пакет Dplyr - манипулируйте данными в R, как в sql
Эта статья является девятой из серии Начало работы с наукой о данных за 30 дней с помощью программирования на языке R . Все остальные статьи вы можете прочитать здесь . Причина огромной популярности sql среди программного сообщества неизменно заключается в лучших и простых методах манипулирования данными, которые он предоставляет с помощью таких команд, как select (), groupby (). Вы когда-нибудь пытались выполнять аналогичные задачи со своими наборами данных в R, например, выбирать..

Как Data Science развивает пищевую промышленность?
Роли/применения науки о данных в пищевой промышленности Введение Неудивительно, что пищевая промышленность является наиболее важным сегментом промышленности в мире. Как клиенты, мы нуждаемся в свежей, чистой и здоровой пище, в то время как как заинтересованные стороны мы должны найти эффективные результаты для производства продуктов питания, поиска продуктов питания, проблем клиентов, предпочтений клиентов, управления цепочками поставок и т. д. Наряду с этим, это не удивительно, что..

Подход к построению модели: генеративный, дискриминационный
Различные алгоритмы машинного обучения применяются для построения моделей для решения сложных задач и достижения лучших результатов. По сути, их можно разделить на два широких подхода — генеративный и дискриминационный. Рассмотрим простую классификационную проблему прогнозирования рака молочной железы как злокачественного или доброкачественного в зависимости от размера опухоли. В этой задаче Y представляет прогнозируемую метку класса (злокачественная/доброкачественная), тогда как..

Краткие размышления об анализе данных о недрах и машинном обучении
Майкл Пирц, PhD, P.Eng (консультант-основатель Daytum) Недра уникальны Из-за (1) разрозненных данных, (2) неоднородной пространственной системы, (3) высокой степени неопределенности, (4) толстого слоя неизбежной интерпретации и (5) чрезвычайно ценные девелоперские решения Мы должны выйти за рамки данных! Аналитика данных — это приложение для очистки данных и статистического анализа, помогающее принимать решения. Надежное использование статистики и знаний в предметной области..

Волшебство данных для вашего бизнеса (машинное обучение)
Видите эти волшебно светящиеся кусочки нейронов? Вот как выглядит нейронная сеть , созданная инженерами данных , просто имитирующая человеческий мозг. А теперь представьте, какие удивительно тонкие и умные они в своей работе! Итак, давайте углубимся в детали. Новая модная технология под названием «Машинное обучение» относительно недавно появилась в широкой среде ИТ. Мало кто знает, что около 80% владельцев корпораций и владельцев бизнеса уже используют его для увеличения продаж...