Я пытаюсь оптимизировать время сканирования запроса. Запрос представляет собой простой запрос диапазона без фильтров. Когда я запускаю запрос, сканирование несоленых данных временных рядов обычно занимает около 10 секунд (около 1,8 миллиона строк, каждая из которых содержит 32-байтовые значения и 40-байтовые ключи).
Стоит ли ожидать ускорения, если я солю данные, а затем запустил сканирование параллельно?
Например, я мог бы случайным образом добавить к каждой строке номер 0,1,2,3,4,5. Тогда я мог бы иметь пул потоков размером 6 для параллельного выполнения 6 отдельных сканирований. Когда я сейчас это делаю, я не вижу никакого ускорения, что наводит на мысль, что, возможно, что-то происходит за кулисами, что свело бы на нет какие-либо преимущества параллельного сканирования.
По этому поводу очень мало документации, поэтому мы будем благодарны за любые рекомендации.