Solr: возврат к старой схеме и прекращение переиндексации

Я случайно остановил экземпляр Solr на своем сервере, у которого была символическая ссылка на более новую схему, чем та, которая использовалась во время работы. После перезапуска сервера solr начал переиндексировать документы, чтобы отразить изменения в новом schema.xml. Однако я не хотел этого и хотел остановить переиндексацию и вернуться к моей старой схеме.

Вопрос: кто-нибудь знает, будет ли остановка сервера solr сейчас (во время переиндексации), изменение старой схемы и повторный запуск сервера будут переиндексировать только недавно переиндексированные файлы обратно в старую схему или переиндексация будет выполняться для всех документов? Проблема в том, что у меня есть данные на пару ГБ, и переиндексация всех документов в новую схему займет много дней....

В настоящее время я бы сказал, что около 2% или около того переиндексируются в schema.xml через 5 часов. Так что, если я смогу вернуть эти 2% за 5 часов, было бы здорово вместо того, чтобы ждать остальные 98%. Если, конечно, возврат к старой схеме означает, что мне нужно переиндексировать 2%, а остальные 98%, которые все еще находятся в старой схеме, у меня нет преимуществ от ее изменения.

Я не могу найти никакой информации в Интернете об этом, я думаю, это необычно иметь так много данных, что переиндексация требует много дней...

Этот вопрос идет в том же направлении, но не дает ответа, если переиндексация достаточно умна, чтобы пропустить все остальные документы: Требуется ли изменение схемы переиндексации всех документов Solr или только документов, содержащих измененные поля схемы?


person mareklspak    schedule 03.03.2015    source источник


Ответы (1)


Таким образом, для тех, кто может столкнуться с той же проблемой, оказывается, что когда вы останавливаете процесс переиндексации (путем остановки сервера) и запускаете его снова с исходной старой схемой, он будет переиндексировать только те несколько документов, которые были изменены более новой схемой и пропустите все остальное и оставьте все как есть.

После этого я предлагаю запустить оптимизацию из панели webadmin, чтобы избавиться от мертвых документов.

Умное солнце :)

person mareklspak    schedule 04.03.2015