Я изучаю Kafka Streams, и у меня проблема с первым примером WordCount в Java 8, взятым из документации.
Использование последних доступных версий потоков kafka, пример лямбда-выражений Kafka Connect и WordCount.
Я выполняю следующие шаги: создаю входную тему в Kafka и выходную. Запустите потоковую передачу приложения, а затем загрузите входную тему, вставив несколько слов из файла .txt.
При первом подсчете в выходной теме я вижу, что слова сгруппированы правильно, но подсчеты неверны. Если я попытаюсь повторно вставить те же слова, все последующие подсчеты из предыдущих неправильных подсчетов будут правильными.
Если я просматриваю дамп входной темы с помощью консоли потребителя, он загружается правильно и грязных данных нет.
Как случилось, что первый раз посчитали неправильно?
Пример [ПЕРВЫЕ ДАННЫЕ]: (введите тему в Kafka) привет привет микрофон микрофон тест
(Стриминг приложения запущен)
(тема вывода) привет 12 микрофон 4 тест 3 (случайные подсчеты)
[ПОСЛЕДНИЕ ДАННЫЕ - Публикация во входной теме одинаковых слов]
(выходная тема) привет 14 майк 6 тест 4
[НОВАЯ ПОПЫТКА]
(выходная тема) привет 16 майк 8 тест 5
и так далее....