Автоматическое индексирование в Solr

Привет, я использую утилиту импорта данных Solr 4 для индексации базы данных Oracle 10g XE. Я использую полный импорт, а также дельта-импорт. Я хочу, чтобы эти процессы были автоматическими. (Например: процессы импорта могут быть рассчитаны по времени или должны выполняться, как только будут изменены какие-либо данные в базе данных). Я искал то же самое в Интернете и слышал, как люди говорят о CRON и скриптах. Однако я не могу понять, как это реализовать. Не могли бы вы предоставить учебник, например объяснение? заранее спасибо


person Archit Arora    schedule 25.07.2013    source источник


Ответы (2)


Пожалуйста, обратитесь к этому предыдущему вопросу: Как я могу запланировать импорт данных в Solr или в качестве альтернативы вы можете рассмотреть возможность создания и использования DataImportScheduler, описанного в разделе Scheduling Страница DataImportHandler на Solr Wiki

person Paige Cook    schedule 25.07.2013

Планировщик Cron с командой wget можно использовать для автоматизации процесса импорта данных. В последней версии solr параметр "?command=" не работает с методом get, поэтому используется метод post, как показано ниже.

wget http://server-url:port/solr/collection-name/dataimport" --post-data 'command=full-import&clean=true&commit=true&wt=json&indent=true&verbose=false&optimize=false&debug=false'

Поскольку задание cron может выполняться с интервалом не менее 1 минуты, если вы хотите выполнять его менее минуты, вы можете подготовить сценарий bash с бесконечным циклом.

#!/bin/bash

while true 
do
    wget "http://server-url:port/solr/collection-name/dataimport" --post-data 'command=full-import&clean=true&commit=true&wt=json&indent=true&verbose=false&optimize=false&debug=false' &> /dev/null
    sleep 5
done
person Vaibhav Panmand    schedule 29.03.2016