Получить данные раздела Cassandra в Apache Spark

Мои данные хорошо организованы по ключу раздела на Cassandra. Я хотел бы получить эти данные в Spark и сохранить те же разделы.

Моя цель - избежать очень большой перетасовки.

PS: я использую Cassandra 2.1 и Spark 1.5.

poiuytrez 04.11.2015 источник

comment

Вам придется уточнить... По умолчанию это то, что делает Spark Cassandra Connector. - RussS 04.11.2015

comment

@RussS Вот что я хотел знать. - poiuytrez 05.11.2015

Ответы (1)

arrow_upward
1
arrow_downward

Соединитель Spark Cassandra считывает диапазоны токенов C* в разделы Spark. Это означает, что все значения для любого заданного ключа раздела Cassandra будут находиться в одном и том же разделе Spark.

https://academy.datastax.com/demos/how-spark-cassandra-connector-reads-data

RussS 05.11.2015

Получить данные раздела Cassandra в Apache Spark

Ответы (1)

Вопросы по теме