Я хотел бы задать вам несколько вопросов по apache kafka и сжатым темам. Мы хотим предоставить некоторые данные PII по сжатой теме kafka. Мы хотим удалить данные по этой теме через надгробие. В настоящее время есть несколько вопросов, по которым мы хотим проверить наши предположения:
- Есть ли другая компания, которая выполняет требование gdpr (право на забвение) в kafka через сжатую тему с генерацией надгробных памятников, такую как KIP-354, предлагает https://cwiki.apache.org/confluence/display/KAFKA/KIP-354%3A+Add+a+Maximum+Log+Compaction+Lag?
- Верно ли наше предположение, что уплотнение запускается только в том случае, если запись отсутствует в файле активного сегмента. Итак, с нашей точки зрения, документацию kafka необходимо изменить, добавив это в пункт 4.8 документации kafka: max.compaction.lag.ms темы можно использовать для гарантии максимальной задержки между написанием сообщения. и время, когда сообщение становится пригодным для сжатия. Здесь следует добавить условие, что сообщение, которое мы хотим сжать, не должно находиться в файле активного сегмента. Это ошибка функции max.compaction.lag.ms или все так, как задумано? На данный момент мы не уверены.
- Срабатывает ли уплотнение только после вставки нового сообщения? Или есть еще асинхронный процесс, который сжимает файлы неактивных сегментов?
Спасибо за ответы ;-)