Я ищу хранилище ключей/значений в python, которое подходит для хранения (и кэширования) ответов HTTP (контент, заголовки HTTP, отметка времени), заданных URL-адресом запроса. Приложение представляет собой механизм веб-скрейпинга, в котором регулярно запрашиваются несколько сайтов. Затем набор процедур анализирует очищенные данные.
Варианты, которые я исследовал до сих пор, включают:
модуль полки python (быстрый, но данные не могут быть распределены, запись только одним процессом)
mongodb (относительно быстрый, пока что лучше всего подходит для того, что я ищу)
CouchDB (слишком медленный для этого приложения)
memcached (не подходит, потому что хранилище не является постоянным, а кэшированные данные не могут быть реплицированы, поправьте меня, если я ошибаюсь)
Некоторые результаты производительности с использованием реальных очищенных данных:
python shelve: 3500 reads/second
couchdb (couchdbkit): 33 reads/second
mongodb (pymongo): 2300 reads/second
redis: 1200 reads/second