Графический загрузчик Datastax из улья с использованием jdbc

Я пробовал использовать:

Database.connection("jdbc:hive2://remote_hive:10000/db_name").driver(???).user("admin").password("admin_password")

какой драйвер я должен использовать для подключения к улью?

Кто-нибудь знает, есть ли какой-нибудь источник документации по API? Или кто-нибудь знает лучший способ, чем использовать пробный прогон для отладки?

лучшая ссылка, которую я смог найти, это https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/dgl/dglJDBC.html

Я просто не знаю, что я должен проверить....


person user1997656    schedule 24.07.2016    source источник
comment
Что вы имеете в виду под ульем? Apache Hive или что-то другое??? Поскольку URL-адрес JDBC для подключения к Apache Hive явно не начинается с jdbc:h2   -  person Samson Scharfrichter    schedule 24.07.2016
comment
Вы правы, я имел в виду улей, хотя не знаю, какой драйвер мне поставить. Я пробовал org.apache.hadoop.hive.jdbc.HiveDriver, но это не работает. думаю, что если это решение, мне нужно поместить файл jar с драйверами где-нибудь на сервер   -  person user1997656    schedule 24.07.2016


Ответы (1)


У вас есть несколько возможных драйверов JDBC для Hive, но я сомневаюсь, что какой-либо из них упакован с Cassandra...

  • ссылка, конечно же, на драйвер Apache (задокументировано здесь), но у него есть некоторые проблемы: он не полностью поддерживает JDBC API (как описано в это сообщение); существует в двух разновидностях: одна "рассеянная" (имеет зависимости от нескольких других hive-*.jar libs и т.д. и т.п. -- см. ссылку выше) и одна так называемая "автономная" (которая все еще имеет зависимости от нескольких утилит hadoop-*.jar и Apache); имеет проблемы с совместимостью версий, т. е. версия драйвера должна быть равна или старше, чем версия HiveServer2
  • хорошей альтернативой является драйвер Cloudera, основанный на Simba SDK (подробности в ссылке выше); но помните, что он предназначен для дистрибутивов Cloudera, поэтому он может не соответствовать последнему выпуску Apache (и у него могут быть собственные ошибки)
  • существует также драйвер DataDirect, который входит в состав многих коммерческих инструментов бизнес-аналитики (от Oracle, IBM, MicroStrategy и т. д.) с OEM-лицензией; но, не считая проблемы с затратами, в прошлый раз, когда я проверял, он не охватывал все варианты подключения Hive (может быть, они сейчас восполнили пробел?)

Первый шаг: загрузите один или несколько драйверов JDBC.

Второй шаг: "подружитесь" с драйвером(ами) -- т. е. проверьте проблемы с CLASSPATH, проблемами синтаксиса URL и т. д. - с помощью утилиты JDBC, такой как DBVisualizer (еще раз см. ссылку выше).

Третий шаг: прибыль!

person Samson Scharfrichter    schedule 24.07.2016
comment
спасибо, чувак, но я имел в виду загрузчик графов dse, когда я использую скрипт groovy, какие драйверы поддерживаются? Могу ли я добавить другие драйверы? улей поддерживается - person user1997656; 24.07.2016
comment
Поддерживает ли загрузчик графов dse подключение hive jdbc? если да, то как я могу его использовать? а есть какие-нибудь API docs? - person user1997656; 25.07.2016