Как Amazon упрощает миграцию устаревших хранилищ данных

Amazon выпускает кубы и другие новые функции SQL для Redshift

Как теперь вы можете использовать ROLLUP, CUBE и GROUPING SETS в предложении GROUP BY

Современные хранилища данных, такие как Snowflake, Google BigQuery и AWS Redshift, характеризуются тем, что они сочетают в себе SQL и NoSQL и основаны на столбцах. С новым обновлением AWS, которое теперь также возможно с кубами, эти современные хранилища данных берут на себя функции, которые часто еще недоступны или должны быть сопоставлены по-другому.

Amazon только что объявила, что Redshift помимо новой функции CUBE теперь также поддерживает новые функции SQL, включая ROLLUP и GROUPING SET, чтобы упростить создание многомерных аналитических приложений [1].



С помощью многомерной аналитики вам необходимо создавать сложные процессы и запросы для агрегирования ключевых бизнес-фактов, таких как доходы и расходы, и анализировать их по нескольким параметрам ваших бизнес-показателей, таких как категория продукта, география и время. С помощью одного оператора SQL, который использует ROLLUP, CUBE и GROUPING SETS в предложении GROUP BY, теперь вы можете использовать эти же возможности, упрощая выполнение аналитики с помощью Amazon Redshift [1][2].

Например, чтобы использовать функцию куба, вы можете использовать следующую схему SQL ниже, а также заглянуть в подключенный источник (официальный блог от AWS), чтобы получить более глубокие знания [3]:

SELECT region_nm, nation_nm, sum(acct_balance) as total_balance 
FROM supp_sample WHERE region_nm in (‘AFRICA’,’AMERICA’,’ASIA’) 
GROUP BY CUBE(region_nm, nation_nm) ORDER BY region_nm, nation_nm;

Однако в настоящее время AWS предлагает эти функции только во всех коммерческих регионах и регионах AWS GovCloud (США), где доступен Amazon Redshift. Остальным приходится ждать, пока он не будет запущен и для других регионов [1].

Amazon должен не только порадовать уже перешедших пользователей и компании, но и побудить ранее скептически настроенных клиентов перенести свои устаревшие системы в облако AWS. Классические хранилища данных часто строятся на основе кубов, и, например, «сведение» таких кубов во вложенные типы данных до сих пор обходилось дорого. Теперь такие структуры можно легко мигрировать.

Источники и дополнительная литература

[1] Amazon, Amazon Redshift объявляет об общей доступности ROLLUP, CUBE и GROUPING SETS в предложении GROUP BY (2023 г.)

[2] eduCBA, Полное руководство по CUBE в SQL с примерами — eduCBA (2023)

[3] AWS, Упрощение запросов онлайн-аналитической обработки (OLAP) в Amazon Redshift с использованием новых конструкций SQL, таких как ROLLUP, CUBE и GROUPING SETS (2023 г.)