Вопросы по теме 'cdap'

Интеграция Cloudera и Cdap
Как добавить CDAP (платформу приложений для хранения данных) в cloudera? Я установил cloudera на свой компьютер и добавил к нему ноду. Теперь я хочу добавить cdap в cloudera на моем узле с помощью менеджера cloudera.
115 просмотров
schedule 08.11.2022

Службы Cask CDAP запущены, но не работают во время установки
Изучив документы по установке CDAP в системе MapR (v6.0) и запуску служб cdap, я обнаружил, что некоторые службы CDAP не запускаются после запуска ( https://docs.cask.co/cdap/current/en/admin-manual/installation/mapr.html#starting-cdap-services ),...
352 просмотров
schedule 12.07.2022

Как удалить временные файлы из CDAP?
Я использую сервер CDAP для 24x7. Но после 5 дней непрерывной работы сервер перезагружается из-за нехватки памяти. CDAP: sandbox ОС: UBUNTU Версия CDAP: 5.0.0
45 просмотров
schedule 29.06.2023

Как использовать Custom Transform в Wrangler?
Я пытаюсь использовать настраиваемое преобразование, используя столбец в плагине Wrangler. Есть ли документация, в которой я могу найти список функций для применения настраиваемого преобразования? Также для конкретного случая я хочу заменить...
1262 просмотров
schedule 28.04.2023

Эквивалентно функции LEFT () в обработчике конвейера данных слияния данных в облаке Google?
Мне нужно перенести рецепты из рецепта dataprep в обработчик конвейера слияния данных. derive type: single value: LEFT(column3, 3) as: 'column3' Когда я ввожу пользовательское преобразование, появляется сообщение об ошибке:...
338 просмотров
schedule 27.04.2022

Плагин CDAP Source для чтения данных с Sftp-сервера
Я хочу прочитать CSV-файл, доступный для Sftp-сервера, с помощью исходного плагина cdap. Я наткнулся на Источник пакета FTP плагин, который делает то же самое. Но при запуске этого я получаю исключение ниже. Caused by: java.io.IOException:...
245 просмотров
schedule 31.08.2022

Использование сжатых файлов с Datafusion
Есть ли способ использовать сжатые файлы с помощью слияния данных в облаке. Я использовал Google Storage в качестве источника и поместил файл gzip в предпочтительное место. В преобразовании обработчика я не вижу предварительного просмотра. Когда...
361 просмотров
schedule 19.03.2023

Как я могу предоставить значения параметров / аргументов времени выполнения через файл для конвейера CDAP
Как добавить параметр / аргументы времени выполнения в конвейер CDAP. Мы можем установить параметры во всех узлах Transforms, Source и Target и вручную ввести значения во время выполнения в средах Datafusion. Однако в производственных средах я...
394 просмотров
schedule 23.05.2022

Как обрабатывать CSV с разными столбцами в CDAP (Datafusion)?
У меня есть случай, когда я получаю несколько CSV от третьих лиц (немного сложно заставить их изменить формат), и эти CSV должны иметь одинаковые столбцы, но иногда один или несколько столбцов отсутствуют. Если я использую файл CDAP (чтение как...
388 просмотров
schedule 28.06.2022

автоматическое определение вложенного ответа json плагина HTTP в datafusion
Я пытаюсь вызвать HTTP GET API с помощью подключаемого модуля пакетного источника HTTP в слиянии данных. Ответ API представляет собой сложный динамический вложенный json, из-за которого я не могу вручную указать схему вывода. Есть ли способ...
189 просмотров
schedule 15.03.2023

Реализация SCD type2 в Data Fusion
Я пытаюсь реализовать type2 в Datafusion. Может ли кто-нибудь помочь в выполнении вставки и обновления, используя преобразования / действия / условия конвейера для достижения этого. Я пытался сгенерировать хеш с помощью Wrangler как для источника,...
249 просмотров

Почему не работает макрос URL-адреса HTTP-плагина datafusion?
Я изучаю макросы в конвейерах слияния данных. Я использую плагин HTTP Sink и пытаюсь включить параметр макроса для параметра URL, например {URL}. когда я пытаюсь развернуть конвейер, возникает следующая ошибка. Не удалось настроить конвейер:...
156 просмотров

Выполнение хранимой процедуры из Cloud Datafusion
Я пытаюсь выполнить хранимую процедуру, которая присутствует в bigquery, используя Datafusion Bigquery Execute, т.е. я вызываю процедуру из команды SQL выполнения большого запроса. Конвейер не работает с исключением Null. Это то, что Bigquery...
340 просмотров

Как предположить, что метка времени - MST (США / Гора) вместо UTC
Я создаю конвейер в Data Fusion, где мы используем подключаемый модуль базы данных для приема данных из нашей локальной базы данных Oracle и вставки в таблицу BigQuery. Подключаемый модуль базы данных правильно определяет timestamp типы данных для...
248 просмотров

Пользовательское преобразование не применяется в обработчике данных в Google Cloud Data Fusion
Я пытаюсь выполнить настраиваемое преобразование в обработчике в Google Cloud Data Fusion. set-column column (parse-as-json :column 2 ) ? column =^ "[" : (parse-as-json :column 1 ) Я хочу проанализировать столбец как JSON до глубины...
443 просмотров

Сшить файлы деталей в один с произвольным именем
Data Fusion Pipeline дает нам один или несколько файлов деталей на выходе при синхронизации в GCS Bucket. Мой вопрос в том, как мы можем объединить эти файлы деталей в один и дать им осмысленное имя?
121 просмотров
schedule 27.06.2023