Je dois me connecter au programme Hive from Java via JDBC . J'ai cherché sur Google et trouvé de nombreux guides et exemples comme celui-ci: clients HiveServer2
Cependant, je ne pouvais trouver le pilote JDBC lui-même (fichier jar) nulle part. Il semble y avoir un fichier jar à télécharger de Cloudera, mais il nécessite une inscription.
Est-ce que quelqu'un sait où obtenir le pilote JDBC Apache Hive?
Ajoutez cette dépendance à votre pom Maven:
<dependency>
<groupId>org.Apache.Hive</groupId>
<artifactId>Hive-jdbc</artifactId>
<version>2.0.0</version>
</dependency>
Le fichier peut être téléchargé à partir de: http://central.maven.org/maven2/org/Apache/Hive/hive-jdbc/2.0.0/Hive-jdbc-2.0.0.jar
Liste complète des versions: http://www.mvnrepository.com/artifact/org.Apache.Hive/hive-jdbc
L'utilisation du pilote Apache est acceptable si votre programme s'exécute sur un hôte avec toutes les bibliothèques Hadoop déjà installées . Sinon, vous devrez faire glisser un groupe de dépendances, c.-à-d.
Emballer toutes ces dépendances dans votre propre JAR aura probablement pour résultat un logiciel volumineux et encombré (Dieu, comment Maven est mal utilisé de nos jours). De plus, vous pouvez avoir un problème de compatibilité car les nouveaux clients ne sont pas compatibles avec les anciens serveurs. "Non compatible" signifie "impossible d'initialiser la connexion avec le serveur Thrift".
Pour une installation autonome, le pilote Cloudera peut être une bonne solution - l'enregistrement signifie simplement laisser l'un de vos courriers indésirables pour obtenir quelques messages marketing (et vous pouvez vous désabonner ensuite). Bien que j'avoue que je ne l'ai jamais utilisé sur un cluster non Cloudera.
Vous pouvez télécharger un pot uber ici:
https://github.com/timveil/Hive-jdbc-uber-jar/releases
Fonctionne tout de suite.
Vous pouvez télécharger le pilote ici. Télécharger Hive-jdbc-0.10.0.jar