Публикации по теме 'combinebykey'
Apache Spark — CombineByKey
Спарк-код для объединения слов, начинающихся с одной буквы.
У нас есть пример данных слов, разделенных пробелом. Мы преобразуем его в JavaPairRDD ‹Character, String›
SparkSession sparkSession = SparkSession.builder().appName("combineByKey").getOrCreate();
JavaSparkContext javaSparkContext = new JavaSparkContext(sparkSession.sparkContext());
List<String> data = Arrays.asList("bat", "mat", "hat", "rat", "cat",..