Я новичок в Spark/Spark Cassandra Connector. Мы впервые пробуем искру в нашей команде, и мы используем коннектор искры cassandra для подключения к базе данных cassandra.
Я написал запрос, который использует тяжелую таблицу базы данных, и я увидел, что Spark Task не запускается до тех пор, пока запрос к таблице не извлечет все записи.
Только получение всех записей из базы данных занимает более 3 часов.
Для получения данных из БД мы используем.
CassandraJavaUtil.javaFunctions(sparkContextManager.getJavaSparkContext(SOURCE).sc())
.cassandraTable(keyspaceName, tableName);
Есть ли способ заставить искру начать работать, даже если все данные не были загружены?
Есть ли возможность указать spark-cassandra-connector использовать больше потоков для выборки?
спасибо, коко.