Я использую CF10, который должен использовать Solr 3.4 в соответствии с enterprisezen.com/2013/11/updating-solr-engine-coldfusion. Я добавил <charFilter class="solr.HTMLStripCharFilterFactory"/>
в <fieldType name="text">
, но поле сводки в результатах поиска по-прежнему включает HTML. Есть идеи, почему?
<field name="summary" type="text" indexed="false" stored="true" required="false" />
http://localhost:8985/solr/test/admin/schema.jsp показывает:
Поле: сводка Тип поля: ТЕКСТ
Свойства: токенизированные, хранимые
Схема: токенизированная, хранимая
Разрыв приращения позиции: 100
Анализатор индекса: org.apache.solr.analysis.TokenizerChain ДЕТАЛИ
Фильтры символов:
org.apache.solr.analysis.HTMLStripCharFilterFactory args: {luceneMatchVersion: LUCENE_24} Класс токенизатора: org.apache.solr.analysis.WhitespaceTokenizerFactory
Фильтры:
org.apache.solr.analysis.StopFilterFactory, аргументы: {words: stopwords.txt ignoreCase: true enablePositionIncrements: true luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.WordDelimiterFilterFilterFactory args: {splitOntcasenCase LUCENE_24 generateWordParts: 1 catenateAll: 0 catenateNumbers: 1} org.apache.solr.analysis.LowerCaseFilterFactory args: {luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.EnglishPorterce_24} org.apache. apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args: {luceneMatchVersion: LUCENE_24} Анализатор запросов: org.apache.solr.analysis.TokenizerChain ДЕТАЛИ
Фильтры символов:
org.apache.solr.analysis.HTMLStripCharFilterFactory args: {luceneMatchVersion: LUCENE_24} Класс токенизатора: org.apache.solr.analysis.WhitespaceTokenizerFactory
Фильтры:
org.apache.solr.analysis.SynonymFilterFactory args: {synonyms: synonyms.txt expand: true ignoreCase: true luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.StopFilterFactory args: {words: stopwords.txtENGNORC: } org.apache.solr.analysis.WordDelimiterFilterFactory, аргументы: {splitOnCaseChange: 1 generateNumberParts: 1 catenateWords: 0 luceneMatchVersion: LUCENE_24 generateWordParts: 1 catenateAll: 0 catenateNumbers: 0} Lower_CatenateAll: 0 catenateNumbers. } org.apache.solr.analysis.EnglishPorterFilterFactory args: {protected: protwords.txt luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args: {luceneMatchVersion:} LuceneMatchVersion:}