Невозможно индексировать десятичные значения из CSV

Я использую SOLR 6.6.2 и пытаюсь обновить ядро ​​с помощью CSV-файла данных автомобиля.

Каждый столбец данных состоит из различных типов данных, таких как целые числа, строки, даты и десятичные значения.

Проблема с десятичными значениями. Я должен обновить их до нуля десятичных знаков, иначе я получаю следующую ошибку:

PS C:\solr-6.6.2\example\exampledocs> java -Dtype=text/csv -Dc="транспортные средства" -jar post.jar cars.csv

с использованием text/csv типа содержимого... Отправка файла cars.csv в [base] SimplePostTool: ПРЕДУПРЕЖДЕНИЕ: Solr вернул ошибку № 400 (неверный запрос) для URL-адреса: http://localhost:8983/solr/vehicles/update SimplePostTool: ПРЕДУПРЕЖДЕНИЕ: Ответ: 400124org.apache.solr.common.SolrExceptionjava.lang. NumberFormatExceptionERROR: [doc=d90354e7-3d73-4718-aeb5-80b0ce8fccf9] Ошибка при добавлении поля «Цена»='7950.01' msg=Для входной строки: «7950.01»400 SimplePostTool: ПРЕДУПРЕЖДЕНИЕ: IOException при чтении ответа: java. io.IOException: сервер вернул код ответа HTTP: 400 для URL-адреса: http://localhost:8983/solr/vehicles/update 1 проиндексированы файлы. ФИКСИРУЕМ изменения индекса Solr на http://localhost:8983/solr/vehicles/update.. Потрачено времени: 0:00:01.363> SimplePostTool версии 5.0.0 Отправка файлов на [базовый] URL http://localhost:8983/solr/vehicles/update

Что не помогает, так это то, что я учусь на видеороликах SOLR с множественным числом, которые используют SOLR версии 4, которая использует schema.xml для определения полей, но, похоже, это устарело в версии 6, и из того, что я читал, не должно быть необходимости изменить схему.


person JGilmartin    schedule 25.05.2018    source источник


Ответы (1)


Там все еще есть схема - и вы должны создать / отредактировать ее явно, чтобы она соответствовала вашим значениям.

Когда вы работаете в режиме без схемы, предположение делается, когда встречается первое значение для поля. Это предположение кажется неверным для вашего набора данных, т. Е. Первое значение по какой-то причине не считается десятичным числом. Вы можете увидеть, какой тип Solr угадал для вашего столбца в браузере схемы в интерфейсе администратора.

Лучшее решение — создать явную схему, чтобы вы были уверены, что ваши столбцы соответствуют определенному типу.

Вы можете редактировать схему непосредственно в Интерфейс администратора, используйте Schema API, или измените файл schema.xml, как в предыдущем версии.

person MatsLindh    schedule 25.05.2018