Не могли бы вы помочь мне найти Java API для переразбиения sales
набора данных на N
фрагментов одинакового размера? Под одинаковым размером я подразумеваю равное количество строк.
Dataset<Row> sales = sparkSession.read().parquet(salesPath);
sales.toJavaRDD().partitions().size(); // returns 1