Импорт Sqoop из кушетки в Hadoop

На Ubuntu, использую Couchbase 2.5.1, Cloudera cdh4, Hadoop-плагин для Couchbase и Oracle JDK 6. Все устанавливается нормально (с виду), я могу работать с Hadoop и Couchbase независимо без проблем, но когда я пытаюсь использовать плагин следующим образом

sqoop import --connect http://127.0.0.1:8091/ --table DUMP

Я получаю следующие ошибки

Please set $ACCUMULO_HOME to the root of your Accumulo installation.
14/04/11 11:44:08 INFO sqoop.Sqoop: Running Sqoop version: 1.4.3-cdh4.6.0
14/04/11 11:44:08 INFO tool.CodeGenTool: Beginning code generation
14/04/11 11:44:08 INFO orm.CompilationManager: HADOOP_MAPRED_HOME is /usr/lib/hadoop-0.20-mapreduce
Note: /tmp/sqoop-vagrant/compile/30e6774902d338663db059706cde5b12/DUMP.java uses or overrides a deprecated API.
Note: Recompile with -Xlint:deprecation for details.
14/04/11 11:44:09 INFO orm.CompilationManager: Writing jar file: /tmp/sqoop-vagrant/compile/30e6774902d338663db059706cde5b12/DUMP.jar
14/04/11 11:44:09 INFO mapreduce.ImportJobBase: Beginning import of DUMP
14/04/11 11:44:09 WARN util.Jars: No such class couchbase doesn't use a jdbc driver available.
14/04/11 11:44:11 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8021. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
14/04/11 11:44:12 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8021. Already tried 1 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
14/04/11 11:44:13 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8021. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)

Есть идеи, где я ошибаюсь? Или что я могу сделать, чтобы узнать?


person Philip O'Brien    schedule 11.04.2014    source источник


Ответы (2)


Кажется, синтаксис, который я использовал, был неправильным. Предполагая, что мы хотим импортировать ведро beer-sample из Couchbase в HDFS, правильный синтаксис приведен ниже, где имя ведра фактически передается как username.

sqoop import --connect http://localhost:8091/pools --password password --username beer-sample --table DUMP
person Philip O'Brien    schedule 18.04.2014

Я не думаю, что вы сможете подключиться к ведру Couchbase с помощью пароля с помощью плагина Couchbase Hadoop. Раньше я получал исключение аутентификации и никогда не мог его решить. Я отредактировал исходный код, и тогда я смог заставить его работать.

person Arun George    schedule 04.12.2014