Как запустить Hadoop в кластере Mesos?

Я пытаюсь настроить кластер Apache Mesos и запустить на нем Hadoop-Job. Документация здесь не на моем уровне, поэтому я не могу понять, и, возможно, кто-то здесь может мне объяснить:

Сначала нужно настроить работающий кластер Hadoop? Или сначала настроить кластер Mesos? куда мне указывать рабов? в файле Hadoop-slaves или использовать только зарегистрированные ведомые устройства Mesos?

hadoop mesos

likeaprogrammer 12.11.2013 источник

Ответы (2)

arrow_upward
10
arrow_downward

Цель Mesos — запустить абстракцию для вашего кластера, где Hadoop будет всего лишь 1 службой среди других. Чтобы это заработало, вам нужно сначала настроить свой кластер Mesos в качестве основного компонента, а затем вы можете начать добавлять такие сервисы, как Hadoop, в этот кластер, используя абстракцию Mesos.

Существует отличный учебник от Mesosphere, на который вам стоит взглянуть, и он объясняет в деталях, как запустить Hadoop поверх Mesos, так что это было бы хорошим местом для начала.

Кроме того, эта компания недавно запустила сервис для Elastic Mesos, аналогичный Elastic MapReduce от Amazon. Поэтому, если вы хотите быстро приступить к работе с Hadoop на Mesos, не мучаясь при настройке всего, это хорошее место для начала.

Charles Menguy 13.11.2013

comment

спасибо, ваш ответ очень помог, но я должен спросить еще одну вещь. Когда я настраиваю кластер Hadoop, это должно быть похоже на стандартные шаги, включая возможность ssh без пароля для ведущего к подчиненным, или у mesos уже есть эта возможность? - likeaprogrammer; 30.11.2013

arrow_upward
3
arrow_downward

После того, как вы настроили и запустили кластер mesos так, что ведомые устройства отображаются в веб-интерфейсе Mesos, вы можете добавить к нему hadoop, выполнив следующие шаги:

Сначала вам нужно настроить HDFS. Распространение Hadoop от Cloudera — это простой способ сделать это. Просто следуйте инструкциям в этом ссылка для настройки. Это автоматически настроит учетные записи пользователей для запуска заданий MapReduce.
Вам просто нужно, чтобы namenode работал на вашем мастере, а datanode — на ведомых. Перейдя к localhost:50070, вы увидите, что namenode запущен и работает, а также предоставит список работающих узлов данных. Вам пока не нужны тасктрекеры или джобтрекеры
Затем, чтобы интегрировать hadoop на mesos, перейдите в этот репозиторий github. Скопируйте его на свой компьютер и следуйте инструкциям в файле Readme.
К этому времени на вашем мастере будет запущен джобтрекер. Перейдите к localhost:50030, чтобы увидеть, что средство отслеживания заданий запущено. Вам не нужны тасктрекеры на ваших рабах. Mesos автоматически запустит их для вас, используя файл tar, который вы загрузили в HDFS.

Также вы можете обратиться к учебнику по мезосфере, если у вас есть какие-либо сомнения. Просто не выполняйте все приведенные здесь шаги, так как они не относятся к последним версиям Mesos.

Aviral Agarwal 30.01.2014

comment

Этот учебник также настраивает HDFS? mesosphere.com/docs/tutorials/ Это немного сбивает с толку, когда говорят «Запусти Hadoop на Месосе». Затем в руководстве по Hadoop упоминается размещение этого файла в HDFS. Подождите, разве HDFS не Hadoop? Курица и яйцо. Я установил Mesos и Marathon на Amazon с помощью этого руководства, и оно работает хорошо: mesosphere.com/ docs/getting-started/datacenter/install Теперь мне нужно добавить HDFS для поддержки некоторых общих файлов Spark. - Jeff Steinmetz; 13.11.2014

comment

Требуется ли YARN для запуска задания hadoop ?? - Kalpesh; 09.08.2016

Как запустить Hadoop в кластере Mesos?

Ответы (2)

Вопросы по теме