У меня есть несколько XML-документов, которые имеют такую структуру:
<root>
<intro>...</intro>
...
<body>
<p>..................
some text CO<sub>2</sub>
.................. </p>
</body>
</root>
Теперь я хочу найти все результаты с фразой CO2, а также хочу получить результаты вышеуказанного типа в результатах поиска. Для этой цели я использую этот запрос -
cts:search
(fn:collection ("urn:iddn:collections:searchable"),
cts:element-query
(
fn:QName("http://iddn.icis.com/ns/fields","body"),
cts:word-query
(
"CO2",
("case-insensitive","diacritic-sensitive","punctuation-insensitive",
"whitespace-sensitive","unstemmed","unwildcarded","lang=en"),
1
)
)
,
("unfiltered", "score-logtfidf"),
0.0)
Но используя это, я не могу получить документ с CO<sub>2</sub>
. Я получаю данные только с простой фразой CO2
.
Если я заменю поисковую фразу на CO 2
, то смогу получить документы только с CO<sub>2</sub>
, а не с CO2
Я хочу получить комбинированные данные для CO<sub>2</sub>
и CO2
в качестве результатов поиска.
Итак, могу ли я каким-либо образом игнорировать <sub>
или есть другой способ решить эту проблему?