Разделение выходных файлов XSLT — группировка по мюнхенскому методу

У меня есть файл XSLT, чтобы преобразовать большой объем данных. Я хотел бы добавить функцию «разделения» либо в виде связанного XSLT, либо в текущем XSLT, который может создавать несколько выходных файлов, чтобы ограничить размер файлов до определенного порога. Предположим, что входной XML выглядит следующим образом:

<People>
<Person>             
<name>John</name>             
<date>June12</date>             
<workTime taskID="1">34</workTime>             
<workTime taskID="2">12</workTime>             
</Person>             
<Person>             
<name>John</name>             
<date>June13</date>             
<workTime taskID="1">21</workTime>             
<workTime taskID="2">11</workTime>             
</Person>
<Person>             
<name>Jack</name>             
<date>June19</date>             
<workTime taskID="1">20</workTime>             
<workTime taskID="2">30</workTime>             
</Person>    
</People>

XSLT-файл, как показано ниже, использует мюнхенскую группировку.

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:key name="PersonTasks" match="workTime" use="concat(@taskID, ../name)"/>
<xsl:template match="/">
    <People>
    <xsl:apply-templates select="//workTime[generate-id() = generate-id(key('PersonTasks',concat(@taskID, ../name))[1])]"/>
    </People>
</xsl:template>

<xsl:template match="workTime">
    <xsl:variable name="taskID">
        <xsl:value-of select="@taskID"/>
    </xsl:variable>
    <xsl:variable name="name">
        <xsl:value-of select="../name"/>
    </xsl:variable>
    <Person>
        <name>
            <xsl:value-of select="$name"/>
        </name>
        <taskID>
            <xsl:value-of select="$taskID"/>
        </taskID>
        <xsl:for-each select="//workTime[../name = $name][@taskID = $taskID]">
            <workTime>
                <date>
                    <xsl:value-of select="../date"/>
                </date>
                <time>
                    <xsl:value-of select="."/>
                </time>
            </workTime>
        </xsl:for-each>
    </Person>
</xsl:template>
</xsl:stylesheet>

Тем не менее, я хотел бы в качестве вывода несколько файлов, как показано ниже, вместо большого. В этом примере я задал только одно имя для каждого файла... но это должен быть параметр.

Выходной файл для первого лица:

<People>
    <Person>
        <name>John</name>
        <taskID>1</taskID>
        <workTime>
        <date>June12</date>
        <time>34</time>
        </workTime>
        <workTime>
        <date>June13</date>
        <time>21</time>
        </workTime>
    </Person>
    <Person>
        <name>John</name>
        <taskID>2</taskID>
        <workTime>
        <date>June12</date>
        <time>12</time>
        </workTime>
        <workTime>
        <date>June13</date>
        <time>11</time>
        </workTime>
    </Person>
</People>

Выходной файл для второго лица:

<People>
    <Person>
        <name>Jack</name>
        <taskID>1</taskID>
        <workTime>
        <date>June19</date>
        <time>20</time>
        </workTime>
    </Person>
    <Person>
        <name>Jack</name>
        <taskID>2</taskID>
        <workTime>
        <date>June19</date>
        <time>30</time>
        </workTime>
    </Person>
</People>

Какой подход с использованием XSLT 1.0 был бы предпочтительным и наиболее элегантным? Есть ли способ вызвать цепочку XSLT внутри XSLT, чтобы разделить выходные файлы?

Ваше здоровье.


person Daniel    schedule 12.11.2010    source источник
comment
Хороший вопрос, +1. Смотрите мой ответ для нескольких способов сделать это.   -  person Dimitre Novatchev    schedule 13.11.2010


Ответы (1)


Есть ли способ вызвать цепочку XSLT внутри XSLT, чтобы разделить выходные файлы?

Несколько способов:

  1. Для этого можно написать функцию расширения — см. документацию по процессору XSLT.

  2. Используйте элемент расширения <exsl:document> EXSLT, если это поддерживается вашим процессором XSLT

  3. Используйте элемент расширения <saxon:output>, если у вас саксон 6.x

  4. В цикле из вашего языка программирования вызовите отдельное преобразование, передав ему в качестве параметра имя человека, для которого нужно получить результаты.

Вот примеры кода для 2. и 3. выше:

Использование <saxon:output> :

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:saxon="http://icl.com/saxon"
  extension-element-prefixes="saxon" >

 <xsl:template match="/">
  <xsl:for-each select="/*/*[not(. > 3)]">
   <saxon:output href="c:\xml\doc{.}">
    <xsl:copy-of select="."/>
   </saxon:output>
  </xsl:for-each>
 </xsl:template>
</xsl:stylesheet>

когда это преобразование применяется к следующему XML-документу:

<nums>
  <num>01</num>
  <num>02</num>
  <num>03</num>
  <num>04</num>
  <num>05</num>
  <num>06</num>
  <num>07</num>
  <num>08</num>
  <num>09</num>
  <num>10</num>
</nums>

создаются три файла: c:\xml\doc1 , c:\xml\doc2 и c:\xml\doc3 с нужным содержимым.

Тот же пример с использованием <exslt:document>:

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:ext="http://exslt.org/common"
  extension-element-prefixes="saxon" >

 <xsl:template match="/">
  <xsl:for-each select="/*/*[not(. > 3)]">
   <ext:document href="c:\xml\doc{.}">
    <xsl:copy-of select="."/>
   </ext:document>
  </xsl:for-each>
 </xsl:template>
</xsl:stylesheet>
person Dimitre Novatchev    schedule 12.11.2010
comment
Я думаю, что exsl:document кажется лучшей идеей. Есть ли у вас какие-либо представления о том, как это будет работать для конкретного примера? - person Daniel; 13.11.2010
comment
@Daniel: я добавил два примера кода: для <exslt:document> и для <saxon:output> - person Dimitre Novatchev; 13.11.2010
comment
@Димитр. Спасибо, и у вас есть какое-то представление о том, как ваше решение может быть объединено с группировкой XSLT в вопросе? - person Daniel; 13.11.2010
comment
@Daniel: Пожалуйста, сделай домашнее задание. Почитайте про мюнхенскую группировку. В созданной вами группе просто поместите <saxon:output> или <exsl:document> внутри <xsl:for-each>, чтобы выбрать все уникальные узлы. Ваш вопрос о том, как написать несколько результатов документа, а не о том, как выполнить группировку. Если у вас проблемы с группировкой, просто прочитайте (много хороших вопросов и ответов есть на SO) или задайте отдельный вопрос. - person Dimitre Novatchev; 13.11.2010
comment
@Daniel: Если вы можете использовать EXSLT, это означает, что вы не используете MSXSL. Таким образом, вы также можете обновить процессор XSLT до версии 2.0. - person ; 14.11.2010
comment
@DimitreNovatchev Знаете ли вы, можно ли как-то запустить решение exsl:document с процессором XSL, включенным в Internet Explorer 8.0? По многим причинам и из-за инструментов, доступных на моем текущем рабочем месте, мне приходится выполнять все преобразования XSL через эту версию IE, и, к сожалению, я продолжаю получать сообщение об ошибке Element ext:document is not known extension element. И еще одно замечание, а не должно ли быть extension-element-prefixes = ext вместо extension-element-prefixes = saxon в вышеупомянутом примере? - person Jagger; 22.01.2014
comment
@Jagger, Нет, IE использует только MSXML (3 и 6 - в зависимости от версии IE), а MSXML не реализует никаких расширений EXSLT. - person Dimitre Novatchev; 22.01.2014
comment
@Jagger, Но вы могли бы использовать SaxonCE, который реализует XSLT 2.0, а это означает, среди прочего, ‹xsl:result-document› - person Dimitre Novatchev; 22.01.2014
comment
@DimitreNovatchev Поверь мне, если бы я мог, я бы так и сделал. :-) На своем личном компьютере я уже давно использую Saxon и XSLT 2.0. Однако на данный момент я работаю в крупном банке, где есть набор стандартного ПО и запросить что-то нестандартное будет стоить слишком много времени, т.к. установка такого ПО во-первых вызовет много вопросов, во-вторых у многих возникнет согласиться на это. Преобразование в конце концов завершится в системе SAP, где доступен только процессор XSLT 1.0. Было бы интересно, если бы он поддерживал exsl. Я дам тебе знать. - person Jagger; 23.01.2014