OpsCenter не показывает доступное хранилище

Я создал новый корпоративный кластер DataStax, которым управляет OpsCenter. Все используемые версии являются последними доступными в репозитории пакетов. Агенты были установлены, и все работает отлично, включая использование ОЗУ, загрузку ЦП и т. д. Я без проблем добавил в этот кластер более 90 ГБ, и хосты могут поддерживать гораздо больше.

Судя по тому, что я вижу, это явно проблема OpsCenter / DataStax-Agent. Я не вижу соответствующей строки в лог-файлах ни OpsCenter, ни DSA. Другие кластеры в том же экземпляре OpsCenter работают без проблем.

Любая идея о том, что может быть проблемой?

Емкость хранилища не работает

Обновление №1. Вывод df(1) на хосте:

Filesystem     Type     1K-blocks     Used Available Use% Mounted on
udev           devtmpfs  16440732        4  16440728   1% /dev
tmpfs          tmpfs      3290304      652   3289652   1% /run
/dev/sda6      ext4     921095148 33460384 840822760   4% /
none           tmpfs            4        0         4   0% /sys/fs/cgroup
none           tmpfs         5120        0      5120   0% /run/lock
none           tmpfs     16451516        0  16451516   0% /run/shm
none           tmpfs       102400        0    102400   0% /run/user
/dev/sda1      ext2        240972    67121    161410  30% /boot

а на другом хосте есть:

Filesystem     Type     1K-blocks     Used Available Use% Mounted on
udev           devtmpfs  16367904        4  16367900   1% /dev
tmpfs          tmpfs      3275852      728   3275124   1% /run
/dev/md1       ext4     958985688 92799452 817449468  11% /
none           tmpfs            4        0         4   0% /sys/fs/cgroup
none           tmpfs         5120        0      5120   0% /run/lock
none           tmpfs     16379256        0  16379256   0% /run/shm
none           tmpfs       102400        0    102400   0% /run/user
/dev/md0       ext3       1014680   105884    856420  12% /boot

Выход https://<host>:<port>/<Cluster-Name>/storage-capacity:

{"free_gb": 0, "used_gb": 0, "reporting_nodes": 3}

person DaKnOb    schedule 08.03.2016    source источник
comment
Извините, не могли бы вы предоставить вывод df для df --print-type --no-sync --local   -  person Chris Lohfink    schedule 16.03.2016
comment
Что показывает переход к http://<host>:<port>/<cluster_name>/storage-capacity в браузере/curl? Пример из моей конфигурации: http://localhost:8888/Test_Cluster/storage-capacity, которая выводит: {free_gb: 398, used_gb: 66, reporting_nodes: 1}   -  person qx3    schedule 25.03.2016
comment
@quilesbaker Сообщение отредактировано. Он показывает 0. Тогда это не проблема пользовательского интерфейса.   -  person DaKnOb    schedule 27.03.2016
comment
В яблочко. На бэкэнде также нет исключений (по крайней мере, на этом уровне) — это покажет узлы отчетов как 0. Обязательно буду держать вас в курсе, как только я смогу воспроизвести на своей установке.   -  person qx3    schedule 28.03.2016
comment
@quilesbaker Большое спасибо .. Может быть, попробовать программный RAID-0 или странные RAID-контроллеры? Возможно, попробуйте с несколькими разделами (/boot, /, /test). В какой-то момент он должен выйти из строя.   -  person DaKnOb    schedule 29.03.2016
comment
Ошибка в OpsCenter @DaKnOb. Если вы запустите df <file>, вы должны получить другую файловую систему, чем если бы вы запустили df --print-type --no-sync --local. Это то, что я считаю причиной ошибки. В моем случае, когда я могу реплицировать, df /home/<user>/random-folder дает /dev/disk/by-uuid/<uuid> в файловой системе/смонтированном столбце.   -  person qx3    schedule 05.04.2016
comment
В качестве временного исправления, пока мы исправим это для следующего выпуска, убедитесь, что вы монтируете (на grub?) свой диск, используемый для данных, используя метку вместо uuid. То есть, если ваша проблема вызвана этим, конечно. Обе метки/выходные данные df диска должны совпадать (на данный момент).   -  person qx3    schedule 06.04.2016
comment
Все диски смонтированы by-uuid. Ты прав. Никогда не думал, что это может вызвать проблемы с OpsCenter. Почувствуйте дерево, чтобы опубликовать это как ответ, чтобы я мог его принять .. :-)   -  person DaKnOb    schedule 06.04.2016


Ответы (2)


Ошибка в агенте. Если вы запустите df <file>, вы должны получить другую файловую систему, чем если бы вы запустили df --print-type --no-sync --local. В моем случае, когда я могу реплицировать, df /home/<user>/random-folder дает /dev/disk/by-uuid/<uuid> в столбце файловой системы.

Это связано с монтированием вашего диска (для загрузки с grub/lilo) с использованием by-uuid вместо метки. Обе метки/выходные данные df должны совпадать.

Это будет исправлено в следующем релизе.

В качестве временного исправления, пока мы исправим это для следующего выпуска, убедитесь, что вы монтируете свой диск, используемый для данных, используя метку вместо uuid, и убедитесь, что эти выходные данные df совпадают.

person qx3    schedule 06.04.2016
comment
Есть идеи, когда вы планируете выпустить следующий релиз? --Спасибо - person DaKnOb; 16.06.2016

Метрика Data Size — это значение, возвращаемое при загрузке узлов (так же, как в разделе «Загрузка:» при выполнении nodetool info).

Емкость хранилища фактически проверяет использование диска в Linux с использованием df (это, вероятно, вообще не работает в некоторых версиях Windows, поэтому, если вы используете Windows, это ваша проблема). С этим было несколько проблем, но в самых последних версиях есть некоторые исправления, поэтому убедитесь, что вы используете новую версию. Проверьте в журналах агентов (/var/log/datastax-agent/agent.log) что-то вроде строк Process failed, которые могут дать более подробную информацию.

person Chris Lohfink    schedule 15.03.2016
comment
Спасибо за ответ! Команда nodetool info действительно возвращает нагрузку, которую можно увидеть в выводе, а также в OpsCenter. Что касается использования df, он нормально показывает вывод на диск. Кластер использует Linux. Журнал в порядке (в основном GET) и не содержит ничего со словом процесса. OpsCenter и DSE находятся в последней версии. - person DaKnOb; 16.03.2016
comment
Вы можете включить свой вывод df в вопрос? иногда такие вещи, как предохранитель или общие сетевые ресурсы, могут все испортить - person Chris Lohfink; 16.03.2016