У меня есть база данных DB2 9.5 с 10 узлами, с необработанными данными на каждой машине (т.е. node1:/scratch/data/dataset.1 node2:/scratch/data/dataset.2 ... node10:/scratch/data/dataset. 10
Нет общего монтирования NFS — ни одна из моих машин не могла обработать все наборы данных вместе взятые.
каждая строка файла набора данных представляет собой длинную строку текста, разделенную столбцами. Первый столбец является ключевым. Я не знаю хеш-функцию, которую будет использовать DB2, поэтому набор данных не разбит на разделы.
Если не считать переименования всех моих файлов, есть ли способ заставить DB2 загружать их все параллельно? Я пытаюсь сделать что-то вроде
загрузить из '/scratch/data/dataset' del, измененного coldel| сообщения fastparse /dev/null заменить на TESTDB.data_table part_file_location '/scratch/data';
но я понятия не имею, как предложить db2 искать набор данных 1 на первом узле и т. д.