По сути, мне нужны метаданные запросов, которые выполнялись в улье за один день. Я просмотрел метаданные, которые предоставляет hive в MySql. Но не удалось найти какую-либо таблицу, в которой хранится информация, связанная с запросом.
Можем ли мы извлечь запросы, которые выполнялись в кусте, с помощью метаданных
Ответы (1)
Проведя небольшое исследование, мы обнаружили, что мы можем извлекать задания MapReduce с помощью REST API History Server для Hadoop.
И отсюда вы получите информацию о работе.
Чтобы получить запрос, вам нужен запрос на конкретную работу.
‹history_server_http_address: порт› / ws / v1 / history / mapreduce / jobs / ‹JOB_ID› / conf
Отсюда вы получите все конфиги. Для запроса вам нужно посмотреть hive.query.string
Мы также можем извлечь JSON задания и конфигурацию этого задания в XML из местоположения hdfs. Для этого вам потребуется значение свойства mapreduce.jobhistory.done-dir.
Затем вы запускаете команду hdfs get для получения данных.
hdfs dfs -get <resource-manager-path>/<year-dir>/<month-dir>/<day-dir> <destination-local-dir>
person
Pash0002
schedule
25.02.2021