- После каждой итерации Kmeans сохраняет ли Hadoop выходные данные, представляющие собой группу кластеров, в HDFS и извлекает их в память на следующей итерации?
- Картографы помещают наблюдения в определенные кластеры. Я имею в виду, что каждый узел должен знать все данные, и Hadoop распределяет только вычисления, а не данные, чтобы каждый узел давал набор наблюдений определенного узла, верно?
Спасибо