У меня есть определенный объем данных в локальном кластере Hadoop (в моей локальной сети), и у меня есть определенный объем данных в кластере Hadoop S3 в облаке Amazon. в обоих местах мои данные находятся в таблицах кустов.
Я хочу запустить запрос куста из моего локального кластера Hadoop, этот запрос должен объединить данные из таблицы куста моего локального кластера и данные таблицы куста из кластера Hadoop amazon s3. Он должен объединять данные из обоих мест и давать результаты
в мою локальную среду кластера, когда я запускаю запрос из моей локальной оболочки улья.
Можно ли решить эту проблему с помощью Amazon Data Pipeline. Если да, пожалуйста, укажите мне путь.
Спасибо, -Суйодха