На сервере Ubuntu я установил Divolte Collector для сбора данных о кликах с веб-сайтов. Данные записываются в канал Kafka с именем divolte-data. Настроив потребителя Kafka, я могу видеть, как поступают данные:
V0:j2ive5p1:QHQbOuiuZFozAVQfKqNWJoNstJhEZE85V0:j2pz3aw7:sDHKs71nHrTB5b_1TkKvWWtQ_rZDrvc2D0:B4aEGBSVgTXgxqB85aj4dGeoFjCqpeEGbannerClickMozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/58.0.3029.96 Chrome/58.0.3029.96 Safari/537.36ChromiumChromium8Google Inc. and contributorsBrowser58.0.3029.96"Personal computer
LinuxCanonical Ltd.
Затем я хотел бы визуализировать данные с помощью Airbnb Superset, который имеет несколько соединителей с общими базами данных, включая druid.io (который может читать Spark).
Похоже, Divolte хранит данные в Kafka неструктурированным способом. Но, по-видимому, он может отображать данные в структурированном виде. Должны ли входные данные быть структурированы в JSON (как сказано в документации)?
А как тогда читать из Druid-Tranquility данные, полученные на канале divolte-data Kafka? Я попытался изменить имя канала в примерах conf, но затем этот потребитель не получил никакого сообщения.