Это вторая часть серии из двух частей от Hadoop Summit.

В соответствующем посте Роб Бердон рассказывает о том, как данные преобразуют все, и о необходимости подключенных платформ данных. В качестве продолжения, вот четыре прогноза для технологий, лежащих в основе этой трансформации.

#1 — ИНТЕЛЛЕКТУАЛЬНЫЕ САМОКОНФИГУРИРУЕМЫЕ СЕТИ ОБЕСПЕЧАТ НОВУЮ И БЫСТРУЮ ДОСТАВКУ ДАННЫХ И АНАЛИТИКУ ЧЕРЕЗ ОБЛАКА ДАННЫХ

Мы все согласны с тем, что количество подключенных устройств и датчиков будет продолжать расти. Объем, разнообразие и сложность данных будут продолжать расти вместе с ним. В настоящее время данные удваиваются каждые несколько лет. Появляется широкий набор общедоступных, частных и гибридных облаков данных.

Потребность в межмашинном (или одноранговом) соединении, которое Интернет всего (IoAT) определяет две вещи: потребность в «интерфейсе вещей» и типах интеллектуальной среды, в которой устройства, которые могут понимать каждый другие могут работать вместе в режиме реального времени, в контексте более широкой потребности или цели. Это также требует, чтобы сети могли расширяться и сжиматься по запросу, а также чтобы сообщения могли маршрутизироваться и расставляться по приоритетам в режиме реального времени.

В этом мире хранилища данных будут заменены облаками данных. Освобожденные от необходимости соответствовать правилам пакетной обработки данных в центрах обработки данных, мы увидим интеллектуальные самонастраивающиеся сети, которые могут обеспечить значимые соединения между устройствами и обеспечить гибкость, позволяющую быстрее и быстрее доставлять новые данные в нужное место. проанализировано.

№ 2 — СВЯЗАТЬ КЛИЕНТОВ, ПРОДУКЦИЮ И ЦЕПОЧКУ ПОСТАВОК

Здесь ключевое значение имеет интегрированная модель, в которой данные и аналитика передаются беспрепятственно. Имейте в виду, что с появлением подключенных устройств наши продукты теперь создают, потребляют и используют данные и являются ключевой частью сквозного бизнес-процесса.

Эта новая реальность со связанными клиентами, продуктами и цепочками поставок требует машинного обучения в режиме реального времени, внутрисистемной совместной работы и аналитики на периферии. Мир больше не будет принимать монолитное программное обеспечение «только централизованно» и хранилища данных. Большинство «умных» устройств будут в той или иной степени взаимодействовать и смогут анализировать то, что говорят друг друга. Алгоритмы машинного обучения в реальном времени в современных приложениях распределенных данных вступят в игру. Алгоритмы, способные выносить решения в режиме «равный-равному» в режиме реального времени.

Данные имеют гравитацию; по-прежнему дорого перемещать по сравнению с хранением в относительном выражении. Это будет стимулировать идею обработки аналитики на периферии, где данные рождаются и существуют, в режиме реального времени, а не перемещать все в облако или обратно в центральное место. Кроме того, нам нужно будет отслеживать все эти межмашинные взаимодействия и то, что происходит в результате, чтобы со временем создавать более качественные и интеллектуальные модели и распределенные решения.

Все мы слышали о беспилотных автомобилях и грузовиках. Только представьте, какое влияние они окажут на жизнь. Будь то повышение безопасности, повышение эффективности использования топлива, более плавное управление дорожным движением, более высокий расход топлива или более дешевый общественный транспорт и перемещение товаров... последствия для личного и экономического положения далеко идущие.

Чтобы автономные автомобили не сталкивались друг с другом, они фактически должны общаться друг с другом напрямую, а также с облаком. Им не терпится вернуться в какое-то место в облаке, запустить алгоритм и дождаться результата. Они должны общаться друг с другом с определенным уровнем интеллекта, поэтому в игру вступают одноранговая и периферийная аналитика.

Автономные автомобили появятся только благодаря подключенным платформам данных, которые смогут устранить разрозненность между данными в состоянии покоя и данными в движении, а также современными приложениями для работы с данными. Например, подумайте обо всей экосистеме данных в поддержку концепции вождения по автостраде в мире самостоятельного вождения и о том, насколько это требует постоянного подключения; от GPS до дорожных карт или переулков, до отчетов о погоде или светофоров на перекрестке. Кроме того, предприятия, которые поддерживают это, должны будут трансформироваться, чтобы установить связь: от страховых агентств до производителей автомобилей и

Кроме того, это также подразумевает новый уровень алгоритмов машинного обучения, которые могут принимать решения в одноранговой сети и в режиме реального времени. Чтобы автономные автомобили не сталкивались друг с другом, они должны общаться друг с другом напрямую. Им не терпится вернуться в какое-то место в облаке, запустить алгоритм и дождаться результата. Они должны общаться друг с другом безопасно и с определенным уровнем интеллекта, поэтому в игру вступают одноранговая и периферийная аналитика. Этому могут способствовать только Connected Data Platforms.

№ 3 — АНАЛИТИКА В РЕАЛЬНОМ ВРЕМЕНИ И НА ГРАНИЦЕ

Я вижу мандат на упреждающую аналитику: от пост-события до анализа и действий в режиме реального времени и до события.

Компании только начинают понимать ценность своих данных и альтернативные издержки отсутствия правильной стратегии для всех типов данных в движении и данных в состоянии покоя.

Однако создание уникальной ценности будет происходить не только за счет обработки и понимания транзакций по мере их возникновения, а затем применения моделей, но и за счет фактического выполнения этого до того, как потребитель или датчик войдет в систему, чтобы что-то сделать.

Я предсказываю, что мы быстро перейдем от пост-событийной и даже в режиме реального времени к упреждающей аналитике, которая может управлять транзакциями, а не просто модифицировать или оптимизировать их. Это окажет преобразующее воздействие на способность бизнеса, ориентированного на данные, выявлять новые потоки доходов, снижать затраты и улучшать отношения с клиентами.

Чтобы предприятия могли успешно работать с данными, приложения и данные должны быть подключены через платформу или структуру. Объединение таких разнородных требований в единый проприетарный продукт или инструмент не получится.

Старые приложения были разрозненными, проприетарными, хорошо структурированными и в большинстве случаев монолитными. Они оперировали только историческими данными. Современные приложения для работы с данными могут получать доступ к большому количеству данных в состоянии покоя и данных в движении, которые можно очень слабо коррелировать в режиме реального времени и применять для машинного обучения.

Идея возможности подключения данных в состоянии покоя и данных в движении на разных платформах данных, между несколькими облачными провайдерами и в центрах обработки данных с реальной переносимостью приложений является центральным отличием между данными будущего и прошлым.

Это основа для современного приложения данных. Современные приложения для работы с данными легко переносимы, контейнеризированы и подключены. Они быстро заменят вертикально интегрированное монолитное программное обеспечение.

# 4 — ДАННЫЕ — ПРОДУКТ КАЖДОГО

В этом новом мире ваш продукт — не единственный продукт, ваши данные — тоже продукт. Или, скорее, анализ, который исходит из ваших данных — о вашей компании, ваших клиентах и ​​вашей экосистеме. Или даже себя. Программное обеспечение можно заменить; ваши данные незаменимы. Это имеет ценность. Защита ваших данных больше не будет касаться только личной информации, а будет касаться сохранения этой ценности как для потребителя, так и для бизнеса.

Для бизнеса современный балансовый отчет в настоящее время уже имеет несколько больше нематериальных ценностей; от стоимости бренда до отпусков и больничных дней, которые могут взять сотрудники. Потребители до сих пор в значительной степени отдавали стоимость своей покупательной способности в социальных сетях и онлайн-торговле, но они будут все больше разбираться в том, как они это делают и делают ли они это.

Итак, являетесь ли вы производителем, перемещающим металл, или индивидуальным потребителем, я предсказываю, что ваши данные станут продуктом, который можно купить, продать или потерять. Появятся новые способы, новые бизнес-модели и новые компании, которые будут искать способы монетизации этого актива.

Мы движемся к обмену и рынку данных. Из этого будут компании, которые будут собирать ваши общедоступные данные и захотят продать их вам, и компании, которые могут выступать в качестве доверенных брокеров данных и предоставлять все облачные и одноранговые инструменты безопасности и конфиденциальности для защиты. вы и ваша личность.