Colonne distincte SQL / Hive count

Question

Comment faire cela dans Hive?

 columnA columnB columnC 100.10 50.60 30 100.10 50.60 30 100.10 50.60 20 100.10 70.80 40

La sortie doit être:

 columnA columnB No_of_distinct_colC 100.10 50.60 2 100.10 70.80 1

Requête que je pense être correcte:

SELECT columnA,columnB,COUNT(distinct column C) from table_name group by columnA,columnB

Est-ce correct? SQL va bien aussi.

MISE À JOUR: Comment puis-je trouver l'écart-type de la colonne C? Besoin de cela dès que possible.

AgentSQL · Accepted Answer

Oui, c'est presque correct. Mais vous avez une simple erreur. Le nom de votre colonne est incorrect dans COUNT.

SELECT columnA,columnB,COUNT(DISTINCT columnC) No_of_distinct_colC from table_name group by columnA,columnB