Comment faire cela dans Hive?
columnA columnB columnC
100.10 50.60 30
100.10 50.60 30
100.10 50.60 20
100.10 70.80 40
La sortie doit être:
columnA columnB No_of_distinct_colC
100.10 50.60 2
100.10 70.80 1
Requête que je pense être correcte:
SELECT columnA,columnB,COUNT(distinct column C)
from table_name
group by columnA,columnB
Est-ce correct? SQL va bien aussi.
MISE À JOUR: Comment puis-je trouver l'écart-type de la colonne C? Besoin de cela dès que possible.
Oui, c'est presque correct. Mais vous avez une simple erreur. Le nom de votre colonne est incorrect dans COUNT.
SELECT columnA,columnB,COUNT(DISTINCT columnC) No_of_distinct_colC
from table_name
group by columnA,columnB