IBM Data Stage - Как найти таблицы базы данных, используемые в заданиях

Для проекта нам нужно исследовать существующую установку IBM Data Stage, выполняющую множество ETL с множеством заданий.

Диаграммы потока заданий содержат множество таблиц, используемых в качестве источника (как в MSSQL, так и в Oracle), а также в качестве цели (в основном в Oracle).

Мой вопрос сейчас

Как найти все таблицы базы данных, используемые всеми заданиями в определенном проекте Data Stage?

Я заглянул в Инструменты - Расширенный поиск, и там я могу увидеть все «определения таблиц». НО, большинство таблиц, фактически используемых в заданиях, там не отображаются, поскольку они определены как то, что Data Stage называет «параллельными заданиями», которые, по сути, являются SQL-запросами к таблицам базы данных.

Я особенно заинтересован в поиске таблиц TARGET, загружаемых заданием.

Проще говоря, я хочу иметь возможность ответить на вопрос «Какое задание загружает таблицу XY?».

Если это невозможно, альтернативой может быть автоматизированное средство извлечения всех операторов SQL, используемых заданиями.

У нас есть доступ к IBM Websphere Data Stage и Quality Stage Designer 8.1.


person Stefan    schedule 26.12.2013    source источник


Ответы (1)


При экспорте заданий создается текстовый файл, в котором подробно описывается, что делает задание. Откройте файл экспорта в текстовом редакторе, и вы сможете найти вставки SQL с помощью простого поиска. Начните с поиска по ключевым словам SQL, таким как INTO и FROM.

Изменить: в качестве альтернативы, если каждая использованная таблица была определена путем импорта определений таблиц, вы сможете найти определение таблицы в папке для ее типа. Однако из этого не будет видно, где и как использовалась таблица (какое задание, вставка или выбор?), Поэтому я бы порекомендовал первый метод поиска файлов экспорта.

person Damienknight    schedule 30.12.2013