Brisk для небольших файлов

Я новичок в Cassandra и Hadoop. В поисках интеграции двух продуктов я наткнулся на Brisk. Из описания я понимаю, что Brisk заменяет HDFS на CassandraFS. Таким образом, эта замена является решением маленьких файлов. Хадуп? Если да, то как насчет больших файлов? В настоящее время мне нужно реализовать хранилище ресурсов, содержащее как большие файлы двоичных данных с их метаданными, так и небольшие файлы, такие как изображения.


person fgakk    schedule 28.09.2011    source источник


Ответы (1)


На самом деле это и то, и другое (хотя я думаю, что Brisk теперь превратился в коммерческий продукт, DataStax Enterprise, и сам по себе активно не развивается).

Brisk включает CassandraFS (cfs), которая является заменой HDFS, поэтому поддерживает большие файлы. Под капотом они разбиты на куски и хранятся в строках/столбцах Cassandra.

Для небольших файлов вы можете хранить данные в собственных строках Cassandra вместо CassandraFS и вместо этого запускать задания Hadoop по строкам.

person DNA    schedule 14.11.2011