Вопросы по теме 'google-cloud-data-fusion'

Как объединить несколько файлов CSV с одинаковой структурой в Cloud Data Fusion?
Я новичок в Cloud Data Fusion. Я хочу объединить два файла CSV. У двух файлов один и тот же столбец. В Cloud Data Fusion я смог найти функцию объединения, но не функцию объединения. Может ли кто-нибудь сказать мне, как объединить несколько файлов...
407 просмотров
schedule 31.03.2022

Добавление дополнительных данных в Bigquery из MySql с помощью Cloud Data Fusion
Я хочу запланировать конвейер, который передает данные MySql в Google Bigquery, но полные данные добавляются к старой таблице в BQ, я хочу, чтобы добавлялись только добавочные данные ...
414 просмотров
schedule 08.06.2022

Подключение к Cloud SQL MySQL
Мы хотели бы протестировать подключение Cloud SQL (mySQL) к BigQuery с помощью Cloud Data Fusion. Каков правильный способ подключения к CloudSQL, поскольку он, похоже, не является «встроенным» на данный момент. Какой драйвер рекомендуется и есть ли...
1091 просмотров
schedule 24.02.2024

Как использовать Custom Transform в Wrangler?
Я пытаюсь использовать настраиваемое преобразование, используя столбец в плагине Wrangler. Есть ли документация, в которой я могу найти список функций для применения настраиваемого преобразования? Также для конкретного случая я хочу заменить...
1262 просмотров
schedule 28.04.2023

Google Cloud Data Fusion - подготовка Dataproc внезапно останавливается без сообщения об ошибке
Я разработал простой конвейер для чтения файла CSV из облачного хранилища и записи в таблицу BigQuery. Во время работы конвейера операция внезапно останавливается без каких-либо сообщений об ошибках в журналах. Уже потребовались правила брандмауэра....
473 просмотров
schedule 22.06.2023

Источник SQL Server в Google Data Fusion не работает (проблема с подтверждением SSL)
Я создал простой конвейер в Data Fusion, который читает из одной таблицы MS SQL Server и записывает в BigQuery. Он не работает при подключении к SQL Server с ошибкой установления связи с сокетом. Я видел эту проблему при создании моих собственных...
366 просмотров

Не удалось подключиться к mysql с помощью слияния данных google
Мне не удалось подключиться к MySQL из слияния данных google Шаг: Сначала я добавляю коннектор https://dev.mysql.com/downloads/file/?id=462850 Во-вторых, я пытаюсь добавить соединение (не удалось) снимок экрана MySQL: Сбой...
709 просмотров
schedule 04.07.2023

Ошибка плагина Saleforce в объединении данных Google Cloud
Я тестирую подключение к продажам из Google Cloud Data Fusion. Я получаю эту ошибку «Ошибка: не обнаружено обнаружение для запроса POST / v3 / namespaces / system / apps / pipeline / services / studio / methods / v1 / context / default /...
378 просмотров
schedule 02.08.2023

Как исправить исключение java.lang.NullPointerException: null при выполнении MSSQL для BigQuery в Cloud Data Fusion
Я работаю над POC Cloud Data Fusion и пытаюсь создать конвейер MSSQL для BigQuery. Соединение работает благодаря тому, что я могу импортировать свою схему из запроса, однако я получаю MapReduce Program "phase-1" failed с...
974 просмотров
schedule 31.01.2023

Эквивалентно функции LEFT () в обработчике конвейера данных слияния данных в облаке Google?
Мне нужно перенести рецепты из рецепта dataprep в обработчик конвейера слияния данных. derive type: single value: LEFT(column3, 3) as: 'column3' Когда я ввожу пользовательское преобразование, появляется сообщение об ошибке:...
338 просмотров
schedule 27.04.2022

Может ли Google Data Fusion производить такую ​​же очистку данных, как DataPrep?
Я хочу запустить модель машинного обучения с некоторыми данными. Перед обучением модели с этими данными мне нужно обработать ее, поэтому я читал несколько способов сделать это. Прежде всего создайте конвейер потока данных, чтобы загрузить его в...
1950 просмотров

Использование сжатых файлов с Datafusion
Есть ли способ использовать сжатые файлы с помощью слияния данных в облаке. Я использовал Google Storage в качестве источника и поместил файл gzip в предпочтительное место. В преобразовании обработчика я не вижу предварительного просмотра. Когда...
361 просмотров
schedule 19.03.2023

Реализация SCD типа 2 в Cloud Data Fusion Pipeline
У меня есть требование применить SCD2 в моем конвейере слияния данных, и мои исходные данные - GCS, а цель - BigQuery. Я создал конвейер и смог загрузить данные в целевой BigQery, поэтому теперь я хочу реализовать процесс слияния и обновления как...
250 просмотров
schedule 13.10.2022

Как обрабатывать CSV с разными столбцами в CDAP (Datafusion)?
У меня есть случай, когда я получаю несколько CSV от третьих лиц (немного сложно заставить их изменить формат), и эти CSV должны иметь одинаковые столбцы, но иногда один или несколько столбцов отсутствуют. Если я использую файл CDAP (чтение как...
388 просмотров
schedule 28.06.2022

автоматическое определение вложенного ответа json плагина HTTP в datafusion
Я пытаюсь вызвать HTTP GET API с помощью подключаемого модуля пакетного источника HTTP в слиянии данных. Ответ API представляет собой сложный динамический вложенный json, из-за которого я не могу вручную указать схему вывода. Есть ли способ...
189 просмотров
schedule 15.03.2023

Можно ли добавить мой собственный плагин пользовательского преобразования к слиянию облачных данных в версии Basic или Enterprise. Просвети пожалуйста
Насколько я понимаю, в Google Cloud Data Fusion Hub доступно множество плагинов преобразования. Однако, если я хочу создать свой собственный специальный плагин, могу ли я добавить этот плагин в объединение данных Google и использовать его в моем...
333 просмотров

Реализация SCD type2 в Data Fusion
Я пытаюсь реализовать type2 в Datafusion. Может ли кто-нибудь помочь в выполнении вставки и обновления, используя преобразования / действия / условия конвейера для достижения этого. Я пытался сгенерировать хеш с помощью Wrangler как для источника,...
249 просмотров

Проблема при подключении конвейера Google Datafusion к базе данных mysql
Я подключаю базу данных MYSQL к google bigquery через конвейер datafusion, я использовал jar-файл драйвера jdbc, я установил его и поместил детали в исходный конвейер, во время просмотра данных в базе данных подключений (mysql) я помещаю подробную...
136 просмотров

Почему не работает макрос URL-адреса HTTP-плагина datafusion?
Я изучаю макросы в конвейерах слияния данных. Я использую плагин HTTP Sink и пытаюсь включить параметр макроса для параметра URL, например {URL}. когда я пытаюсь развернуть конвейер, возникает следующая ошибка. Не удалось настроить конвейер:...
156 просмотров

Выполнение хранимой процедуры из Cloud Datafusion
Я пытаюсь выполнить хранимую процедуру, которая присутствует в bigquery, используя Datafusion Bigquery Execute, т.е. я вызываю процедуру из команды SQL выполнения большого запроса. Конвейер не работает с исключением Null. Это то, что Bigquery...
340 просмотров