Qu'est-ce que Hive, est-ce une base de données?

Question

Je viens de commencer à explorer Hive. Il a toutes les structures similaires à un SGBDR comme les tables, les jointures, les partitions .. ce que je comprends, c'est que Hive utilise toujours HDFS pour le stockage et c'est une abstraction SQL de HDFS. À partir de là, je ne suis pas sûr que Weather Hive lui-même soit une solution de base de données comme HBase, Cassnadra .. ou simplement un système de requête au-dessus de HDFS. Je ne pense pas que ce soit simplement un langage de requête car il a des tables, des jointures et des partitions ..

Sandeep Singh · Accepted Answer

Hive est un ensemble/infrastructure d'entreposage de données construit sur Hadoop. Il fournit un dialecte SQL appelé Hive Query Language (HQL) pour interroger les données stockées dans un cluster Hadoop. Comme tous les dialectes SQL couramment utilisés, HQL n'est pas entièrement conforme à une révision particulière de la norme ANSI SQL. Il est peut-être le plus proche du dialecte de MySQL, mais avec des différences importantes. Hive n'offre aucune prise en charge pour les insertions, les mises à jour et les suppressions au niveau des lignes. Hive ne prend pas en charge les transactions. Nous ne pouvons donc pas le comparer avec le SGBDR. Hive ajoute des extensions pour fournir de meilleures performances dans le contexte de Hadoop et pour s'intégrer avec des extensions personnalisées et même des programmes externes. Il est bien adapté pour le traitement par lots de données telles que: traitement des journaux, exploration de texte, indexation de documents, intelligence d'affaires orientée client, modélisation prédictive, test d'hypothèse, etc.

Hive n'est pas conçu pour le traitement des transactions en ligne et ne propose pas de requêtes en temps réel.