каков фактический идеальный размер памяти NameNode при большом количестве файлов в HDFS

У меня будет 200 миллионов файлов в моем кластере HDFS, мы знаем, что каждый файл будет занимать 150 байтов в памяти NameNode плюс 3 блока, так что в NN всего 600 байтов. Поэтому я установил в моей NN-памяти 250 ГБ для обработки 200 миллионов файлов. Мой вопрос в том, что такой большой объем памяти в 250 ГБ окажет слишком большое давление на сборщик мусора? Возможно ли создание 250GB памяти для NN.

Can someone just say something, why no body answer??

person Jack    schedule 29.05.2016    source источник
comment
вероятно, потому что конфигурация точной настройки не имеет правильного ответа и требует глубокого анализа вашего кластера, также ваш вопрос, похоже, касается GC, а не того, что подразумевает фактическое название вопроса, что вводит в заблуждение   -  person fd8s0    schedule 13.06.2016


Ответы (2)


Идеальный размер памяти узла имени - это примерно общее пространство, используемое мета-данными + ОС + размер демонов и 20-30% пространства для обработки связанных данных.

Вы также должны учитывать скорость, с которой данные поступают в ваш кластер. Если у вас есть данные, поступающие со скоростью 1 ТБ / день, вы должны подумать о большем объеме памяти, иначе у вас скоро закончится память.

Всегда рекомендуется иметь не менее 20% свободной памяти в любой момент времени. Это поможет избежать попадания узла имени в полную сборку мусора. Как указал Марко ранее, вы можете ссылаться на конфигурацию сборки мусора NameNode : Рекомендации и обоснование конфигурации GC.

В вашем случае 256 выглядит хорошо, если вы не собираетесь получать много данных и не собираетесь выполнять много операций с существующими данными.

См .: Как спланировать емкость для кластера Hadoop?

См. Также: Выберите подходящее оборудование для своего нового кластера Hadoop

person Ani Menon    schedule 13.06.2016

В вашем namenode может быть 256 ГБ физической памяти. Если ваши данные увеличиваются в огромных объемах, подумайте о федерации hdfs. Я предполагаю, что у вас уже есть многоядерные ядра (с гиперпоточностью или без) в имени узла узла. Предположите, что приведенная ниже ссылка решает ваши проблемы с GC: https://community.hortonworks.com/articles/14170/namenode-garbage-collection-configuration-best-pra.html

person Marco99    schedule 07.06.2016