Можем ли мы сканировать и индексировать документы Google Диска с помощью nutch и solr?

Я попытался проиндексировать общедоступный URL-адрес документа на диске Google, но, похоже, это не работает. Есть ли способ просканировать документы Google Диска через nutch и сделать их индекс с помощью solr?


person Saurabh Chaturvedi    schedule 01.06.2015    source источник


Ответы (1)


Используйте API Google Диска для чтения/управления файлами

https://developers.google.com/drive/web/about-sdk

Страница Drive Public URL не будет иметь прямых ссылок на подкаталоги, поэтому вы ничего не получите, если просканируете эти страницы.

person Ramanan    schedule 01.06.2015