Как запустить Hadoop в кластере Mesos?

Я пытаюсь настроить кластер Apache Mesos и запустить на нем Hadoop-Job. Документация здесь не на моем уровне, поэтому я не могу понять, и, возможно, кто-то здесь может мне объяснить:

Сначала нужно настроить работающий кластер Hadoop? Или сначала настроить кластер Mesos? куда мне указывать рабов? в файле Hadoop-slaves или использовать только зарегистрированные ведомые устройства Mesos?


person likeaprogrammer    schedule 12.11.2013    source источник


Ответы (2)


Цель Mesos — запустить абстракцию для вашего кластера, где Hadoop будет всего лишь 1 службой среди других. Чтобы это заработало, вам нужно сначала настроить свой кластер Mesos в качестве основного компонента, а затем вы можете начать добавлять такие сервисы, как Hadoop, в этот кластер, используя абстракцию Mesos.

Существует отличный учебник от Mesosphere, на который вам стоит взглянуть, и он объясняет в деталях, как запустить Hadoop поверх Mesos, так что это было бы хорошим местом для начала.

Кроме того, эта компания недавно запустила сервис для Elastic Mesos, аналогичный Elastic MapReduce от Amazon. Поэтому, если вы хотите быстро приступить к работе с Hadoop на Mesos, не мучаясь при настройке всего, это хорошее место для начала.

person Charles Menguy    schedule 13.11.2013
comment
спасибо, ваш ответ очень помог, но я должен спросить еще одну вещь. Когда я настраиваю кластер Hadoop, это должно быть похоже на стандартные шаги, включая возможность ssh без пароля для ведущего к подчиненным, или у mesos уже есть эта возможность? - person likeaprogrammer; 30.11.2013

После того, как вы настроили и запустили кластер mesos так, что ведомые устройства отображаются в веб-интерфейсе Mesos, вы можете добавить к нему hadoop, выполнив следующие шаги:

  1. Сначала вам нужно настроить HDFS. Распространение Hadoop от Cloudera — это простой способ сделать это. Просто следуйте инструкциям в этом ссылка для настройки. Это автоматически настроит учетные записи пользователей для запуска заданий MapReduce.
  2. Вам просто нужно, чтобы namenode работал на вашем мастере, а datanode — на ведомых. Перейдя к localhost:50070, вы увидите, что namenode запущен и работает, а также предоставит список работающих узлов данных. Вам пока не нужны тасктрекеры или джобтрекеры
  3. Затем, чтобы интегрировать hadoop на mesos, перейдите в этот репозиторий github. Скопируйте его на свой компьютер и следуйте инструкциям в файле Readme.
  4. К этому времени на вашем мастере будет запущен джобтрекер. Перейдите к localhost:50030, чтобы увидеть, что средство отслеживания заданий запущено. Вам не нужны тасктрекеры на ваших рабах. Mesos автоматически запустит их для вас, используя файл tar, который вы загрузили в HDFS.

Также вы можете обратиться к учебнику по мезосфере, если у вас есть какие-либо сомнения. Просто не выполняйте все приведенные здесь шаги, так как они не относятся к последним версиям Mesos.

person Aviral Agarwal    schedule 30.01.2014
comment
Этот учебник также настраивает HDFS? mesosphere.com/docs/tutorials/ Это немного сбивает с толку, когда говорят «Запусти Hadoop на Месосе». Затем в руководстве по Hadoop упоминается размещение этого файла в HDFS. Подождите, разве HDFS не Hadoop? Курица и яйцо. Я установил Mesos и Marathon на Amazon с помощью этого руководства, и оно работает хорошо: mesosphere.com/ docs/getting-started/datacenter/install Теперь мне нужно добавить HDFS для поддержки некоторых общих файлов Spark. - person Jeff Steinmetz; 13.11.2014
comment
Требуется ли YARN для запуска задания hadoop ?? - person Kalpesh; 09.08.2016