Я использую WebHDFSSensor, и для этого нам нужно предоставить namenode. Однако активный namenode и резервный namenode изменяются. Я не могу просто указать текущий хост namenode для webhdfs_conn_id. Мне нужно создать соединение с обоих хостов. Я попытался предоставить хост в виде массива, но это не сработало.
Итак, мой вопрос: давайте рассмотрим, что мне нужно соединение с именем webhdfs_default, и оно мне нужно для 2 хостов w.x.y.z и a.b.c.d. Как мне это создать?
PythonOperator
передWebHDFSSensor
, чтобы обновитьwebhdfs_conn_id
. См. это, это и это . Также знайте, что (не решение) технически вы можете иметь несколько подключений, определенных сconn_id='webhdfs_conn_id'
, и в этом случае Airflow будет случайно выбрать один из этих - person y2k-shubham   schedule 07.09.2020..the only difference between them is we can read and write from active namenode..
разве это не может быть ответом? ВPythonOperator
вы пытаетесь читать и писать в список узлов (IP) один за другим; и тот, который проходит, является активным (и вы устанавливаете его IP вwebhdfs_conn_id
) - person y2k-shubham   schedule 09.09.2020