Я все еще изучаю улей. Я ссылался на несколько книг для понимания концепции ведер в улье. Я узнал, что если мы обеспечим группировку, будет создано точно такое же количество файлов, как и количество корзин.
В моем случае я буду постепенно загружать данные в таблицу с сегментами пять раз в день. Например: если у меня есть таблица с 16 сегментами, то при каждой загрузке она будет создавать 16 файлов на основе хэшей/выборок. Таким образом, всего за 5 прогонов будет создано 80 файлов.
My Question is , if i have table with 16 buckets defined on it with 80 files
in HDFS, will it going to give bucketing benefits ?