Создание каталога метаданных в Marklogic

Я пытаюсь объединить данные из нескольких источников, таких как СУБД, файлы xml, веб-сервисы, используя Marklogic. Для этого, как я вижу из документации MarkLogic в каталоге метаданных (https://www.marklogic.com/solutions/metadata-catalog/), виртуализация данных (https://www.marklogic.com/solutions/data-virtualization/) и объединение данных вполне возможно. Но я не могу получить какую-либо документацию, описывающую, как именно это сделать или какие инструменты использовать для достижения этой цели.

Ищем какие-то указатели.


person user3615683    schedule 09.05.2014    source источник
comment
Я использую пробную версию Marklogic 7.   -  person user3615683    schedule 09.05.2014


Ответы (2)


Как показывает второе изображение в ссылке на виртуализацию данных, вам необходимо загрузить все данные в базы данных MarkLogic. Затем MarkLogic можно поместить между ними, чтобы он стал единственной точкой входа для приложений конечных пользователей, которым необходим доступ к этим данным.

Первая ссылка описывает возможности MarkLogic для хранения всех видов данных. Частично он делает это, сохраняя их как есть, частично извлекая текст и метаданные для поиска, частично путем преобразования (если вам нужно выйти за рамки того, что позволяет исходный формат).

Для этой цели MarkLogic предоставляет универсальный инструмент MarkLogic Content Pump (MLCP). Он позволяет принимать заархивированные или разархивированные файлы и при необходимости применять преобразования. Если вам нужно получить данные из другой базы данных, вам может потребоваться немного больше усилий, чтобы получить это. http://developer.marklogic.com содержит учебные пособия, блоги и инструменты, которые помогут вам начать работу. Поиск в списке рассылки MarkLogic через http://marklogic.markmail.org/ также может дать ответы.

ХТХ!

person grtjn    schedule 09.05.2014
comment
Согласно следующей видеопрезентации команды marklogic youtube.com/watch?v=tiNqlSmM6T4. данные не нужно вводить в репозиторий. К нему можно получить виртуальный доступ с помощью метаданных. Если бы кто-то мог показать, как это сделать технически. :-( - person user3615683; 12.05.2014
comment
Не просматривая всю презентацию (немного длинноватую): я думаю, речь идет о работе с большими бинарниками. Вы можете фильтровать метаданные и текст из более чем 200 двоичных форматов, используя xdmp:filter. Для этого требуется как минимум доступ к файлу из MarkLogic. После этого вы можете либо сохранить только метаданные со ссылкой на исходное местоположение, либо просто сохранить их. В последнем случае, если он превышает пороговое значение (по умолчанию 1 МБ), он автоматически сохраняется в файловой системе, но управляется MarkLogic. Это не относится к первому. - person grtjn; 12.05.2014

Объединение большого количества данных — очень широкая тема. Можете ли вы описать несколько типов данных, которые вы хотели бы интегрировать, и какие службы или запросы вы хотели бы создать на основе этих данных?

person Damon Feldman    schedule 12.05.2014
comment
Я хочу объединить данные xml, которые я загрузил в репозиторий marklogic, с некоторыми данными, которые у меня есть в базе данных сервера sql, без фактического перемещения данных в репозиторий marklogic (покажите виртуализацию корпуса). - person user3615683; 12.05.2014
comment
единственный инструмент, который я задержал, был MLSAM, который позволяет мне подключаться и выполнять запросы к базе данных SQL Server (или другой СУБД). Но я считаю, что это не доказывает виртуализацию данных. Для виртуализации данных я должен иметь возможность создать на сервере Marklogic представление данных, присутствующих во внешнем источнике. И это можно сделать, создав каталог метаданных для внешнего источника. Пожалуйста, дайте мне знать, если мое понимание неверно. - person user3615683; 12.05.2014