Можем ли мы использовать Logstash
и Kibana
для анализа больших данных?
Я буду использовать Hadoop для хранения своих данных. Прежде чем что-либо пробовать, я хочу знать, пробовал ли кто-нибудь это уже.
Можем ли мы использовать Logstash
и Kibana
для анализа больших данных?
Я буду использовать Hadoop для хранения своих данных. Прежде чем что-либо пробовать, я хочу знать, пробовал ли кто-нибудь это уже.
На самом деле я использовал HDFS + ElasticSearch + Kibana + Logstash для работы с Hive. Это работает довольно хорошо. Хотя, если вы пытаетесь загрузить данные из ElasticSearch в Hive без правильного объявления типов данных, вы можете получить значения NULL для своих данных.
--- Hive Coonection ---
Убедитесь, что файлы es-hadoop-hive-2.0.2.jar
и es-hadoop-2.0.2.jar
расположены в вашем каталоге Hive.
Следуйте документации на веб-сайте ElasticSearch для получения более подробной информации.
Насколько велики ваши данные?
На данный момент я использую Logstash + ElasticSearch + Kibana для анализа более 50 ГБ данных журнала.
Elasticsearch также имеет интеграцию с Hadoop.
Перейдите по этой ссылке: http://www.elasticsearch.org/overview/hadoop/
125 ГБ (предположительно) 1000 документов в неделю — это около 200/сек, что не представляет проблемы для любой конфигурации logstash/elasticsearch для индексации.
Найди себе 6 машин: