Quelle est la différence entre les fonctions RANK()
et DENSE_RANK()
? Comment trouver le nième salaire dans le tableau emptbl
suivant?
DEPTNO EMPNAME SAL
------------------------------
10 rrr 10000.00
11 nnn 20000.00
11 mmm 5000.00
12 kkk 30000.00
10 fff 40000.00
10 ddd 40000.00
10 bbb 50000.00
10 ccc 50000.00
Si dans la table les données ont nulls
, que se passera-t-il si je veux connaître le salaire nth
RANK vous donne le classement dans votre partition ordonnée. Les égalités se voient attribuer le même rang, le ou les prochains rangs étant ignorés. Donc, si vous avez 3 éléments au rang 2, le rang suivant sera classé 5.
DENSE_RANK vous donne à nouveau le classement dans la partition que vous avez commandée, mais les rangs sont consécutifs. Aucun rang n'est ignoré s'il existe des rangs comportant plusieurs objets.
En ce qui concerne les valeurs NULL, cela dépend de la clause ORDER BY. Voici un script de test simple avec lequel vous pouvez jouer pour voir ce qui se passe:
with q as (
select 10 deptno, 'rrr' empname, 10000.00 sal from dual union all
select 11, 'nnn', 20000.00 from dual union all
select 11, 'mmm', 5000.00 from dual union all
select 12, 'kkk', 30000 from dual union all
select 10, 'fff', 40000 from dual union all
select 10, 'ddd', 40000 from dual union all
select 10, 'bbb', 50000 from dual union all
select 10, 'xxx', null from dual union all
select 10, 'ccc', 50000 from dual)
select empname, deptno, sal
, rank() over (partition by deptno order by sal nulls first) r
, dense_rank() over (partition by deptno order by sal nulls first) dr1
, dense_rank() over (partition by deptno order by sal nulls last) dr2
from q;
EMP DEPTNO SAL R DR1 DR2
--- ---------- ---------- ---------- ---------- ----------
xxx 10 1 1 4
rrr 10 10000 2 2 1
fff 10 40000 3 3 2
ddd 10 40000 3 3 2
ccc 10 50000 5 4 3
bbb 10 50000 5 4 3
mmm 11 5000 1 1 1
nnn 11 20000 2 2 2
kkk 12 30000 1 1 1
9 rows selected.
Voici un lien vers une bonne explication et quelques exemples.
Cet article ici l'explique bien. Essentiellement, vous pouvez le voir comme tel:
CREATE TABLE t AS
SELECT 'a' v FROM dual UNION ALL
SELECT 'a' FROM dual UNION ALL
SELECT 'a' FROM dual UNION ALL
SELECT 'b' FROM dual UNION ALL
SELECT 'c' FROM dual UNION ALL
SELECT 'c' FROM dual UNION ALL
SELECT 'd' FROM dual UNION ALL
SELECT 'e' FROM dual;
SELECT
v,
ROW_NUMBER() OVER (ORDER BY v) row_number,
RANK() OVER (ORDER BY v) rank,
DENSE_RANK() OVER (ORDER BY v) dense_rank
FROM t
ORDER BY v;
Ce qui précède donnera:
+---+------------+------+------------+
| V | ROW_NUMBER | RANK | DENSE_RANK |
+---+------------+------+------------+
| a | 1 | 1 | 1 |
| a | 2 | 1 | 1 |
| a | 3 | 1 | 1 |
| b | 4 | 4 | 2 |
| c | 5 | 5 | 3 |
| c | 6 | 5 | 3 |
| d | 7 | 7 | 4 |
| e | 8 | 8 | 5 |
+---+------------+------+------------+
Dans les mots
ROW_NUMBER()
attribue une valeur unique à chaque ligneRANK()
attribue le même numéro de ligne à la même valeur, en laissant "trous"DENSE_RANK()
attribue le même numéro de ligne à la même valeur, sans laisser de "trous"SELECT empno,
deptno,
sal,
RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM emp;
EMPNO DEPTNO SAL rank
---------- ---------- ---------- ----------
7934 10 1300 1
7782 10 2450 2
7839 10 5000 3
7369 20 800 1
7876 20 1100 2
7566 20 2975 3
7788 20 3000 4
7902 20 3000 4
7900 30 950 1
7654 30 1250 2
7521 30 1250 2
7844 30 1500 4
7499 30 1600 5
7698 30 2850 6
SELECT empno,
deptno,
sal,
DENSE_RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM emp;
EMPNO DEPTNO SAL rank
---------- ---------- ---------- ----------
7934 10 1300 1
7782 10 2450 2
7839 10 5000 3
7369 20 800 1
7876 20 1100 2
7566 20 2975 3
7788 20 3000 4
7902 20 3000 4
7900 30 950 1
7654 30 1250 2
7521 30 1250 2
7844 30 1500 3
7499 30 1600 4
7698 30 2850 5
rank () : Il est utilisé pour classer un enregistrement dans un groupe de lignes.
dense_rank () : La fonction DENSE_RANK agit comme la fonction RANK sauf qu'elle assigne des rangs consécutifs.
Requête -
select
ENAME,SAL,RANK() over (order by SAL) RANK
from
EMP;
Sortie -
+--------+------+------+
| ENAME | SAL | RANK |
+--------+------+------+
| SMITH | 800 | 1 |
| JAMES | 950 | 2 |
| ADAMS | 1100 | 3 |
| MARTIN | 1250 | 4 |
| WARD | 1250 | 4 |
| TURNER | 1500 | 6 |
+--------+------+------+
Requête -
select
ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from
EMP;
Sortie -
+--------+------+-----------+
| ENAME | SAL | DEN_RANK |
+--------+------+-----------+
| SMITH | 800 | 1 |
| JAMES | 950 | 2 |
| ADAMS | 1100 | 3 |
| MARTIN | 1250 | 4 |
| WARD | 1250 | 4 |
| TURNER | 1500 | 5 |
+--------+------+-----------+
select empno
,salary
,row_number() over(order by salary desc) as Serial
,Rank() over(order by salary desc) as rank
,dense_rank() over(order by salary desc) as denseRank
from emp ;
Row_number()
-> Utilisé pour générer le numéro de série
Dense_rank()
donnera un rang continu mais le rang sera sauté en cas de conflit de rang.
La seule différence entre les fonctions RANK () et DENSE_RANK () réside dans les cas où il existe une «égalité»; c'est-à-dire, dans les cas où plusieurs valeurs d'un ensemble ont le même classement. Dans de tels cas, RANK () attribuera des "rangs" non consécutifs aux valeurs de l'ensemble (ce qui entraînera des écarts entre les valeurs de classement entières en cas d'égalité), tandis que DENSE_RANK () attribuera des rangs consécutifs aux valeurs de ensemble (de sorte qu’il n’y aura pas d’écart entre les valeurs de classement des nombres entiers en cas d’égalité).
Par exemple, considérons l'ensemble {25, 25, 50, 75, 75, 100}. Pour un tel ensemble, RANK () retournera {1, 1, 3, 4, 4, 6} (notez que les valeurs 2 et 5 sont ignorées), alors que DENSE_RANK () retournera {1,1,2,3, 3,4}.
Rank () La fonction SQL génère un classement des données dans un ensemble de valeurs ordonné, mais le classement suivant le classement suivant est row_number de cette ligne. D'autre part, la fonction SQL Dense_Rank () génère le numéro suivant au lieu de générer row_number. Voici l'exemple SQL qui clarifiera le concept:
Select ROW_NUMBER() over (order by Salary) as RowNum, Salary,
RANK() over (order by Salary) as Rnk,
DENSE_RANK() over (order by Salary) as DenseRnk from (
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 2000 as Salary union all
Select 3000 as Salary union all
Select 3000 as Salary union all
Select 8000 as Salary union all
Select 9000 as Salary) A
Il générera la sortie suivante:
----------------------------
RowNum Salary Rnk DenseRnk
----------------------------
1 1000 1 1
2 1000 1 1
3 1000 1 1
4 2000 4 2
5 3000 5 3
6 3000 5 3
7 8000 7 4
8 9000 8 5
Rank et Dense rank donne le classement dans le jeu de données partitionné.
Rang (): Il ne vous donne pas de nombres entiers consécutifs.
Dense_rank (): Il vous donne des nombres entiers consécutifs.
Dans l'image ci-dessus, le rang de 10008 Zip est 2 par la fonction dense_rank () et 24 par la fonction rank () car il considère le numéro de ligne.