Я совершенно новичок в больших данных, последние несколько недель я пытаюсь создать приложение для анализа журналов.
Я прочитал много статей и обнаружил, что потоковая передача Kafka + spark — самая надежная конфигурация.
Теперь я могу обрабатывать данные, отправленные моим простым производителем kafka java, для запуска потоковой передачи.
Может кто-нибудь предложить несколько вещей, таких как 1) как я могу читать журналы сервера в реальном времени и передавать их брокеру kafka. 2) какие-либо фреймворки доступны для передачи данных из журналов в Kafka? 3) любые другие предложения??
Спасибо, Чоудари.