Последние несколько недель были заняты в области Enterprise Knowledge Graph (EKG). В этом блоге мы рассмотрим ключевые события и поместим их в контекст нового поколения мыслителей графических систем, пытающихся понять общие тенденции, которые будут доминировать в компьютерной индустрии в следующие несколько лет.

Первым событием стало объявление о том, что TigerGraph получил дополнительные $ 105 млн венчурного капитала в раунде сбора средств серии C. Это не должно вызывать удивления, поскольку TigerGraph уже занимает лидирующие позиции на рынке ЭКГ благодаря трем фактам:

  1. Он был разработан с нуля как горизонтально масштабируемый график, в котором используется популярная модель данных графа помеченных свойств (LPG).
  2. Он очень оптимизирован для производительности, поскольку написан на эффективном C / C ++. Они устранили медленный устаревший код Java, работающий на виртуальных машинах. Любой, кто сравнивает TigerGraph с другими графиками, легко поймет, почему они заняли лидирующие позиции в области ЭКГ.
  3. Он предлагает настоящее новшество, позволяющее легко писать распределенные запросы в стиле MapReduce с помощью расширенного языка GSQL и накопителей. Разработчикам нравятся эти функции.

TigerGraph лидирует, показывая, что распределенная архитектура графа свойств с метками будет доминировать в ландшафте ЭКГ будущего.

Следующим большим объявлением стало объявление Katana Graph о завершении финансирования серии A привлечением невероятных 28,5 миллионов долларов. Обратите внимание, что это финансирование серии A, которое обычно намного меньше 28,5 миллионов долларов. Что интересно в анонсе, так это то, что его провела Intel Capital при поддержке Dell Technologies Capital. Те из вас, кто является постоянным читателем моего блога, могут заметить, что я писал об усилиях Intel's PIUMA в предыдущем посте. Я был рад видеть, что многие статьи ссылаются на мой блог об архитектуре Intel PIUMA!

Хотя эти инвестиции велики, они бледнеют по сравнению с 222 млн долларов в виде финансирования серии E, которые были вложены в Graphcore в январе. Большинство людей не думают о Graphcore как о компании EKG, поскольку их внимание было сосредоточено на ускорении рабочих нагрузок машинного обучения и снижении затрат на определенные графические алгоритмы с помощью API Poplar уровня C. У них еще нет графической базы данных с ACID-гарантиями транзакций, которые необходимы ЭКГ. Однако акцент Graphcore на большом количестве ядер, инновационном доступе к памяти и вычислениях с разреженными матрицами прямо соответствует целям революции встраивания повсюду, которую ценят архитекторы EKG / ML.

Graphcore также работал с Cirrascale, чтобы предоставить новый облачный сервис под названием GraphCloud, который упростит тестирование этих новых аппаратных архитектур. Cirrascale упрощает доступ к аппаратным вычислениям с настраиваемыми графами прямо из ваших ноутбуков Jupyter, работающих на виртуальных машинах в любом месте или в облаке.

Общая картина здесь такова, что руководители как Intel, так и Dell теперь гораздо глубже осознают разрушительное влияние, которое ЭКГ окажет на корпоративные вычисления в масштабах всей отрасли. Они также понимают, что одного оборудования будет недостаточно. Для крупных организаций предоставления низкоуровневого C API недостаточно, даже если вы можете в 1000 раз повысить производительность графических запросов. Специалисты по обработке данных должны будут иметь возможность выполнять быстрые графические запросы непосредственно к высококачественным связанным данным в стандартизированном GQL из своих блокнотов Jupyter.

Руководство Intel и Dell знает, что для того, чтобы быть по-настоящему эффективным, им необходимо предоставить своим клиентам полное решение, которое позволит их клиентам списать их дорогостоящие устаревшие системы COBOL и реляционные базы данных. Руководители Intel и Dell ценят, что горизонтально масштабируемые системы переключения указателей позволят функции JOIN для миллиардов таблиц занять свое место в анналах истории компьютерных наук, но не частью современного технологического стека, управляемого AI / ML, где каждая вершина имеет встроенную функцию. во встраивании. Чтобы быть конкурентоспособными в будущем, компаниям нужны более продуктивные знающие инженеры и меньше обработчиков данных.

Мы также продолжаем видеть значительный прогресс в признании того, что сообществу LPG нужны общие стандарты запросов, чтобы их запросы были переносимы между системами EKG. Если у вас не было возможности посмотреть Видео-интервью GQL с Аластером Грином, я бы порекомендовал его. Алистер придает большое значение благородным (но непростым) усилиям по выражению наших сложных алгоритмов графов краткими, выразительными и переносимыми языками.

Мы также должны отметить, что поставщики облачных сервисов (CSP), такие как Amazon AWS, Microsoft Azure и Google, по-прежнему остаются в основном в стороне в пространстве EKG. Хотя мои контакты в CSP выражают мимолетный интерес к GQL, их бизнес-модели зависят от развертывания горизонтально масштабируемых компонентных компьютерных служб, работающих на стандартном оборудовании в их центрах обработки данных. И они не против того, чтобы ограничивать компании их собственными языками запросов графов. CSP не приведут нас к разработке переносимых языков запросов графов следующего поколения.

Поставщики оборудования знают, что Amazon AWS выходит на рынок нестандартных кремний со своими чипами Graviton. Бизнес-модель CSP по-прежнему ориентирована на предоставление небольших недорогих вычислительных мощностей, которые можно масштабировать при необходимости. Они не сосредотачиваются на соглашениях об обслуживании с малой задержкой между своими серверами. Решениям EKG требуются уровни обслуживания в наносекундном масштабе между всеми узлами кластера. Модели затрат CSP отличаются недорогим хранилищем больших объемов данных и вычислениями по требованию.

ЭКГ определяются путем выполнения запросов в реальном времени по большим объемам данных, которые охватывают множество серверов. Проблемы с CSP, развертывающими ЭКГ, связаны с ограничениями скорости света. Свет распространяется примерно на 1 фут за наносекунду. Системы Intel PIUMA и Graphcore предполагают, что весь ваш граф содержится в одной или нескольких стойках, соединенных высокоскоростными сетями с малой задержкой. Вот как работают обходы графа с триллионом вершин в кластерах. CSP не могут гарантировать, что их виртуальные машины будут находиться в одной стойке или даже в одном здании. Это означает, что для того, чтобы операторы связи вышли на рынок ЭКГ, им необходимо будет переосмыслить свою инфраструктуру.

Я считаю, что техническое руководство таких компаний-производителей оборудования, как Intel и Dell, теперь понимает, что они конкурируют с CSP, которые создают собственное оборудование. Intel и Dell знают, что для того, чтобы стать участниками центров обработки данных будущего, им необходимо возглавить разработку как локальных, так и облачных графических решений. Решениям нового поколения для ЭКГ необходимы явные преимущества в соотношении цена-качество, которые операторы связи не могут предложить сегодня. Если Intel и Dell продолжат финансировать инновационные стартапы ЭКГ, такие как Katana Graph, они будут предоставлять комплексные решения «под ключ» для своих корпоративных клиентов, создающих ЭКГ следующего поколения.

Я хочу уделить минуту, чтобы выразить надежду, что больше руководителей технологических компаний оценят то, что делают технические руководители Intel и Dell. Они сосредоточены не только на дебатах о скорости и подаче, которыми мы так много занимаемся при обсуждении аппаратного обеспечения. Эти дискуссии быстро забываются.

Финансируя такие компании, как Katana Graph, технические лидеры говорят о долгосрочном подходе системного мышления к созданию решений для своих клиентов. Они видят преимущества более целостного взгляда на технологический ландшафт. Они также более чутко относятся к проблемам своих клиентов при создании действительно интегрированной центральной нервной системы своих организаций. Только после того, как мы сможем выполнять рентабельные запросы в реальном времени по графам с триллионами вершин, мы сможем предлагать эти инновационные услуги нашим клиентам.

И последнее: мой энтузиазм по поводу этих инвестиций является моим собственным, и мое мнение не следует интерпретировать как одобрение со стороны моего работодателя.