Marklogic загружает данные с использованием потоков информационной студии (недопустимая ссылка на объект)

Я пытаюсь загрузить данные, используя потоки информационной студии. У меня есть 1 XML-документ (1,65 ГБ). Когда я загружаю его, я получаю эту ошибку XDMP-DOCENTITYREF Invalid entity reference. Я не знаю, как это решить.


person s.e    schedule 12.03.2016    source источник


Ответы (1)


В XML ссылка на объект выглядит примерно так: & -- & и ; это код, относящийся к символу (в данном случае амперсанд). «Недопустимая ссылка на объект» говорит о том, что анализатор MarkLogic не распознает, что там находится. Это может быть просто символ "&" без экранирования в тексте или он может быть в правильной форме с неверным значением. Проверьте журнал ошибок, чтобы понять, что вы ищете, или где это находится в исходном документе.

Пока мы на этом, вы, вероятно, не хотите загружать документ размером 1,65 ГБ целиком. Есть ли контент более низкого уровня, из которого можно сделать хорошие отдельные документы? (Например, RSS-канал будет одним XML-документом с несколькими записями.) Если вы можете разделить этот документ, у вас гораздо больше шансов получить хорошее поведение.

Для этого попробуйте использовать MarkLogic Content Pump возможность разделения документа. MLCP был создан для этого типа работы.

person Dave Cassel    schedule 05.01.2017