Вопросы по теме 'spark-checkpoint'
Spark Checkpointing: содержимое, восстановление и идемпотентность
Я пытаюсь понять содержимое контрольной точки и соответствующего восстановления; понимание процесса создания контрольных точек, очевидно, является естественным способом, поэтому я просмотрел следующий список:
сообщение в среднем
ТАК...
287 просмотров
schedule
16.07.2022
Как справиться со сценарием сбоя в Spark, записать в файл orc
У меня есть вариант использования, когда я передаю данные из Mongodb в HDFS в файле orc, который запускается каждые 1 день и добавляет данные в файл orc, существующий в hdfs.
Теперь меня беспокоит, если при записи в файл orc задание каким-то...
236 просмотров
schedule
30.08.2022
контрольная точка искры: ошибка java.io.FileNotFoundException
У меня есть текущий конвейер, в котором я выполняю несколько преобразований своего фрейма данных.
Важно вставлять контрольные точки, чтобы гарантировать приемлемое время выполнения.
Однако время от времени я получаю эту ошибку на любой из...
424 просмотров
schedule
30.06.2023
Spark Structured Streaming — можно ли записать смещение дважды
Я использую структурированную потоковую передачу искры, чтобы получать данные из темы кафки и записывать данные в другой приемник кафки.
Я хочу сохранить смещение дважды - один раз при чтении из темы и пошевелить смещение. Во-вторых, при записи...
105 просмотров
schedule
01.12.2022
Как сохранить местоположение контрольной точки Spark Streaming в S3?
Меня интересует приложение Spark Streaming (Spark v2.3.2), которое получает данные паркета S3 и записывает данные паркета в S3. Поток фреймов данных приложения использует groupByKey() и flatMapGroupsWithState() для использования GroupState ....
829 просмотров
schedule
20.01.2023