Cassandra - использование HDD и SSD не имеет значения в пропускной способности

Контекст
В настоящее время я запускаю тесты с Apache Cassandra в кластере с одним узлом. Я убедился, что кластер запущен и работает, используя статус nodetool, я выполнил множество операций чтения и записи, которые предполагаются как таковые, и я уверен, что мой кластер настроен правильно. Теперь я пытаюсь увеличить пропускную способность, установив SSD в каталог, в который Cassandra записывает свои данные.

Мое решение
Место записи данных Cassandra обычно находится в / var / lib / cassandra / data, однако с тех пор я переключил свое, используя cassandra.yaml, для записи в другое место, где я ' я смонтировал свой SSD. Я убедился, что Кассандра пишет в это место, проверив размер содержимого каталога данных с помощью watch du -h и других методов. Каталог, в который я смонтировал SSD, включает данные таблицы, журнал фиксации, подсказки, каталог вложенных данных и сохраненные кэши.

Проблема
Я использовал тесты YCSB (см. https://github.com/brianfrankcooper/YCSB), чтобы проверить среднюю пропускную способность и количество операций в секунду для Cassandra. Я не заметил разницы в средней пропускной способности при установке HDD и SSD в том месте, куда Cassandra записывает свои данные. Я проанализировал доступ к диску через dstat -cd --disk-util --disk-tps и обнаружил, что жесткие диски ограничивают использование ЦП в нескольких случаях, тогда как SSD в нескольких случаях поднимается только до 80%.

Вопрос
Как я могу увеличить пропускную способность Cassandra, используя SSD вместо HDD? Я предполагаю, что это правильное место для установки моего SSD, но разве Cassandra не использует свою дополнительную вычислительную мощность? Любая помощь будет принята с благодарностью!


person NolanRudolph    schedule 22.03.2020    source источник
comment
вы отслеживали активность диска как с hdd, так и с ssd?   -  person Hadi Moloodi    schedule 22.03.2020
comment
Только что обновил мой вопрос информацией, спасибо за предложение!   -  person NolanRudolph    schedule 22.03.2020


Ответы (1)


SSD всегда должен побеждать HDD с точки зрения задержки и т. Д. Это просто закон физики. Думаю, ваш тест просто не давал достаточной нагрузки на систему. Другая проблема может заключаться в том, что вы подключаете только данные к SSD, но не журналы фиксации - на жестких дисках они всегда должны быть помещены на отдельный диск, чтобы избежать конфликтов с загрузкой данных. На SSD они могут быть помещены на тот же диск, что и данные - пожалуйста, укажите во всех каталогах SSD, чтобы увидеть разницу.

Я рекомендую проводить сравнение, используя следующие инструменты:

person Alex Ott    schedule 22.03.2020