Используйте функцию Solr Schemaless без автоматического добавления неизвестных полей в управляемую схему

У меня есть разные источники данных, которые загружают разные документы в Solr Sink. Теперь, если два источника данных отправляют одно и то же поле имени с разными типами данных (скажем, целое и двойное), то индексация второго поля завершается ошибкой, поскольку тип данных первого поля уже добавлен в управляемую схему.

Все, что мне нужно, это правильно проиндексировать оба поля, поскольку они работали в версиях Solr 4.x.

Поскольку имена полей появляются во время выполнения, предложите решение, которое мне подойдет. Я предполагаю, что требуется изменение в solrconfig.xml, но не смог найти нужное.


person 100rabh    schedule 20.06.2016    source источник


Ответы (1)


Как ваш Solr был настроен для работы в 4.x? Вы все еще можете сделать это точно так же в Solr 6.

С другой стороны, функция без схемы будет определять сопоставление типов при первом просмотре поля. У него нет возможности узнать, что произойдет в будущем. Вот почему все автоопределения являются многозначными.

Однако, если вы хотите иметь дело со слишком узким конкретным сопоставлением целого числа, вы можете изменить определение цепочки UpdateRequestProcessor, которая фактически выполняет сопоставление. Просто объедините сопоставление integer/long/number в один окончательный тип tdoubles.

person Alexandre Rafalovitch    schedule 21.06.2016