Публикации по теме 'big-data'


Задержки рейсов в районе залива
Хэл Райт, июль 2016 г. Введение Организация коммерческих авиаперевозок — это логистическая проблема, которая ежедневно затрагивает большое количество потребителей в США. Каждый год в США совершаются миллионы внутренних рейсов, и в 2015 году около 38% всех внутренних рейсов были задержаны. Задержки доставляют неудобства пассажирам и якобы обходятся американским потребителям в миллиарды долларов ежегодно . Резюме Целью этого проекта было создание инструмента, который реализует..

Хорошо обученная обезьяна против команды выпускников Гарварда в сфере интеллектуального анализа данных
Хорошо обученная обезьяна против команды выпускников Гарварда в сфере интеллектуального анализа данных Эта статья является второй в серии статей о будущем прогнозной аналитики и науки о данных. Первая была опубликована под трогательным названием Споры на остывающем трупе науки о данных . Благодаря многолетней истории обучения гипнотическому маркетингу необычайной ценности прогностической аналитики большинство людей считают ее сверхъестественной наукой и верят, что лишь несколько..

Как Nike использует прогнозную аналитику
Как Nike использует прогнозную аналитику Данные с судьбой. Заголовки сделали недавнее приобретение Nike компании Celect, занимающейся прогнозной аналитикой. В более широком контексте это приобретение имеет большой смысл. 87% доходов Nike поступает от оптовых покупателей, но гигант спортивной одежды хочет вернуть себе право на обслуживание клиентов. Все это связано с членством в NikePlus, и легко понять, почему; участники тратят на Nike.com в три раза больше, чем гости...

4 ПРОГНОЗА, КАК ДАННЫЕ ИЗМЕНЯЮТ ВСЕ
Это вторая часть серии из двух частей от Hadoop Summit. В соответствующем посте Роб Бердон рассказывает о том, как данные преобразуют все, и о необходимости подключенных платформ данных. В качестве продолжения, вот четыре прогноза для технологий, лежащих в основе этой трансформации. #1 — ИНТЕЛЛЕКТУАЛЬНЫЕ САМОКОНФИГУРИРУЕМЫЕ СЕТИ ОБЕСПЕЧАТ НОВУЮ И БЫСТРУЮ ДОСТАВКУ ДАННЫХ И АНАЛИТИКУ ЧЕРЕЗ ОБЛАКА ДАННЫХ Мы все согласны с тем, что количество подключенных устройств и датчиков будет..

Как использовать контроль версий данных (dvc) в проекте машинного обучения
Работая над продуктивным проектом машинного обучения, вы, вероятно, имеете дело с большим количеством данных и несколькими моделями. Чтобы отслеживать, какие модели были обучены с какими данными, вы должны использовать систему для версии данных, аналогичную управлению версиями и отслеживанию вашего кода. Одним из способов решения этой проблемы является dvc (Data Version Control, https://dvc.org/ ), который подходит к управлению версиями данных аналогично Git. Чтобы проиллюстрировать..

Выполните линейную регрессию с использованием Python, Spark и MLlib для работы с большими данными
Хотя в этой статье мы не будем использовать распределенные данные, мы будем строить модель линейной регрессии с использованием Python, Spark и MLlib, чтобы у нас была интуиция для машинного обучения, когда дело доходит до работы с большими данными. Начнем с создания сеанса Spark, from pyspark.sql import SparkSession spark = SparkSession.builder.appName('lrex').getOrCreate() Теперь из pyspark импортируем функцию регрессии лайнера точно так же, как мы это делали бы с библиотекой..

Экстремальная наука о данных
Экстремальная наука о данных - это экономия времени и возможность быстро представить готовые решения. То есть, как можно быстро извлечь пользу из данных? Некоторые из серьезных проблем с традиционной наукой о данных - это трудоемкое исследование, очистка и проектирование функций, специфичных для каждого набора данных. Кроме того, почти всегда требуются часы ручной установки значений и принятия решений человеком. Вдобавок ко всему, все манипуляции с набором данных должны..