Использование опции -output_uri_replace

Я загружаю документы JSON в базу данных MarkLogic через MLCP. Мой входной файл представляет собой файл JSON с разделителями строк. По умолчанию мой URI принимает форму путь/имя файла/split_start_seqnum. Вместо этого я хотел бы, чтобы URI содержал значения двух элементов для определенного документа.

Например, каждый документ представляет ресторан, и есть такие элементы, как restaurant_name, restaurant_zip, restaurant_hours и т. д. Я бы хотел, чтобы URI представлял собой комбинацию из restaurant_name и restaurant_zip. Как мне закодировать это в скрипте MLCP?


person Meghan Noonan    schedule 02.01.2019    source источник


Ответы (1)


-output_uri_replace может быть полезен для внесения более статических изменений в uri с шаблонами регулярных выражений, но не позволяет извлекать значения из содержимого. Лучшим подходом для этого было бы использование MLCP Transforms.

Этот ответ SO содержит пример и некоторые указатели на документацию:

Использование модуля преобразования во время загрузки MLCP в MarkLogic

ХТХ!

person grtjn    schedule 07.01.2019