Я не знаю, есть ли какой-либо алгоритм для получения оптимального раздела для раздела данных на основе ключа (необходимо обеспечить одинаковые ключевые записи в одном и том же результирующем наборе данных).
Например: у меня есть набор данных, который нужно разделить на две части:
key num_of_records
k1 20
k2 15
k3 2
k4 3
k5 5
Существует 2 ^ 5 видов разных разделов. Такие как
part1: k1 k3 k4 (total records: 25)
part2: k2 k5 (total records 20)
И еще один раздел:
part1: k1 k4 (total records 23)
part2: k2 k3 k5 (total revords 22)
Последний раздел лучше первого, так как он позволяет более равномерно распределить количество записей на две части.
Итак, мне нужен алгоритм для поиска оптимального раздела.
Может ли кто-нибудь дать мне несколько предложений по этой теме? Как я мог подойти к этой проблеме?
Спасибо.