Вопросы по теме 'hive-partitions'

Могу ли я переместить данные из одного раздела улья в другой раздел той же таблицы
Мой раздел основан на году / месяце / дате. Использование SimpleDateFormat для недели года создало неправильный раздел. Данные для даты 2017-31-12 были перенесены на 2018-31-12 с использованием YYYY в формате даты. SimpleDateFormat sdf = new...
2317 просмотров
schedule 09.01.2023

Может ли улей метастор виртуально разделить данные на основе значения столбца без физического изменения структуры каталогов?
В качестве примера рассмотрим, что у меня есть данные обо всех произошедших крупных спортивных событиях. Схема приведена ниже. Имя события, Дата, Месяц, Год, Город Это данные, которые физически структурированы в HDFS по году, дате, месяцу....
84 просмотров

установить расположение раздела в запросе динамического раздела «Вставить перезапись» в кусте
Я создал таблицу кустов с базовым местоположением, указывающим на местоположение AWS S3. Однако я хочу создать раздел в кластере HDFS, используя запрос «Вставить перезапись». Шаги ниже: -- Create intermediate table create table test_int_ash (...
1484 просмотров
schedule 07.11.2023

Что происходит с запросом пользователя, когда я обмениваюсь разделами в Hive?
Каково взаимодействие с пользователем при обмене разделами в Apache Hive? Является ли он атомарным или дискретным и состоит из нескольких шагов, таких как: partition rename data copy old partition drop table repair ?
187 просмотров
schedule 06.06.2024

Как разделить таблицу по месяцам и дням в улье
Я создал таблицу с: CREATE EXTERNAL TABLE extab ( vendorID string, orderID string , ordertime string ) location '/common_folder/data' Затем я создал раздел по месяцам и дням CREATE EXTERNAL TABLE part_extab( endorID string, orderID...
1130 просмотров
schedule 18.04.2023

Как разбить таблицу по всем значениям?
У меня есть внешняя таблица, теперь я хочу добавить в нее разделы. У меня 224 уникальных идентификатора города, и я хочу просто написать alter table my_table add partition (cityid) location /path; , но улей жалуется, говоря, что я ничего не...
302 просмотров
schedule 03.05.2022

pyspark - получение последней секции из логики секционированных столбцов Hive
Я новичок в pySpark. Я пытаюсь получить последний раздел (раздел даты) таблицы улья, используя PySpark-dataframes, и делаю это, как показано ниже. Но я уверен, что есть лучший способ сделать это, используя функции фрейма данных (а не написав SQL)....
3710 просмотров

Как сделать так, чтобы результат запроса разделялся на вход?
Я новичок в улье, поэтому основной вопрос: как мне создать запрос, чтобы результат этого запроса был разделен определенным образом? Например: CREATE TABLE IF NOT EXISTS tbl_x ( x SMALLINT, y FLOAT) PARTITIONED BY (id SMALLINT) ROW FORMAT...
104 просмотров

Как вставить / скопировать данные одного раздела в несколько разделов улья?
У меня есть данные day='2019-01-01' в моей таблице улья, я хочу скопировать те же данные на весь январь-2019 месяц. (т.е. в '2019-01-02' , _3 _..._ 4_) Я пытаюсь подписаться, но данные вставляются только в «2019-01-02», а не в «2019-01-03»....
926 просмотров

невозможно получить доступ к таблице кустов в импале
Невозможно получить доступ к таблице кустов в Impala, в которой есть раздел, созданный в столбце даты. Данные вставляются с использованием параметра столбца динамического раздела. Теперь тип данных даты не поддерживается в импале. что я должен...
289 просмотров

Hive не использует разделы в запросе
У меня есть представление, которое позволяет извлекать самые свежие данные для таблицы истории Hive. Таблица истории разбита по дням. Представление работает очень просто - в нем есть подзапрос, который устанавливает максимальную дату в поле даты...
385 просмотров
schedule 14.04.2022

получить последние данные из таблицы кустов с несколькими столбцами разделов
У меня есть таблица улья со структурой ниже ID string, Value string, year int, month int, day int, hour int, minute int Эта таблица обновляется каждые 15 минут и разбита на столбцы год / месяц / день / час / минута. Ниже приведены примеры...
855 просмотров

Hive sql - между несколькими разделами
У меня таблица-улей разбита по годам, месяцам и дням CREATE TABLE t1 ( ... ) PARTITIONED BY ( year INT, month INT, day INT' ) STORED AS PARQUET; и мне нужно взять с него данные за последние 7 дней / разделов. Первый шаг к поиску того, как...
48 просмотров
schedule 09.12.2022

Hive - обязательно ли иметь «=» для внешней таблицы, чтобы рассматривать ее как раздел
Я новичок в Hive и у меня есть следующий основной вопрос: Я пытаюсь создать внешнюю таблицу в каталоге HDFS по адресу /projects/score/output/scores_2020-06-30.gzip но он не рассматривает его как раздел. Если разработчику нужно изменить...
156 просмотров

Добавление нового раздела во внешнюю таблицу Hive с помощью блоков данных
У меня есть папка, в которой раньше были подпапки, основанные на ingestiontime , который также является оригинальным PARTITION , используемым в его таблице Hive. Итак, папка выглядит как -...
807 просмотров

Динамическая секционированная таблица в кусте не обновляет последние разделы
У меня есть папка в ведре gcs со структурой папок как Xyz/Abc/dt=03-12-2021/file_03-12-2021.csv Xyz/Abc/dt=04-12-2021/file_04-12-2021.csv Я пытаюсь создать динамическую секционированную таблицу поверх папки, выполнив следующие запросы Set...
102 просмотров
schedule 18.08.2022

Hive: читать разделы таблицы, определенные в подзапросе
У меня есть таблица Hive, которая разделена полем partitionDate. Я могу прочитать выбранный мной раздел с помощью простого select * from myTable where partitionDate = '2000-01-01' Моя задача - указать выбранный мной раздел динамически . Т.е....
35 просмотров
schedule 24.01.2023