Supprimer les lignes en double de la table dans Oracle

Question

Je teste quelque chose dans Oracle et remplis une table avec des exemples de données, mais dans le processus, j'ai chargé par erreur des enregistrements en double. Je ne peux donc pas créer de clé primaire à l'aide de certaines colonnes.

Comment puis-je supprimer toutes les lignes en double et n'en laisser qu'une?

Bill the Lizard · Accepted Answer

Utilisez la pseudo-colonne rowid.

DELETE FROM your_table WHERE rowid not in (SELECT MIN(rowid) FROM your_table GROUP BY column1, column2, column3);

Où column1, column2 et column3 constituent la clé d'identification de chaque enregistrement. Vous pouvez lister toutes vos colonnes.

Dead Programmer · Answer

De demandez à Tom

delete from t where rowid IN ( select rid from (select rowid rid, row_number() over (partition by companyid, agentid, class , status, terminationdate order by rowid) rn from t) where rn <> 1);

(corrigé la parenthèse manquante)

user187624 · Answer

DELETE FROM tablename a WHERE a.ROWID > ANY (SELECT b.ROWID FROM tablename b WHERE a.fieldname = b.fieldname AND a.fieldname2 = b.fieldname2)

Mark · Answer

De DevX.com :

DELETE FROM our_table WHERE rowid not in (SELECT MIN(rowid) FROM our_table GROUP BY column1, column2, column3...) ;

Où column1, column2, etc. est la clé que vous souhaitez utiliser.

DoOrDie · Answer

Solution 1)

delete from emp where rowid not in (select max(rowid) from emp group by empno);

Solution 2)

delete from emp where rowid in ( select rid from ( select rowid rid, row_number() over(partition by empno order by empno) rn from emp ) where rn > 1 );

Solution 3)

delete from emp e1 where rowid not in (select max(rowid) from emp e2 where e1.empno = e2.empno );

Mohammed khaled · Answer

créer la table t2 comme select distinct * from t1;

user1799846 · Answer

Pour sélectionner les doublons, seul le format de la requête peut être:

SELECT GroupFunction(column1), GroupFunction(column2),..., COUNT(column1), column1, column2... FROM our_table GROUP BY column1, column2, column3... HAVING COUNT(column1) > 1

Donc, la requête correcte selon une autre suggestion est:

DELETE FROM tablename a WHERE a.ROWID > ANY (SELECT b.ROWID FROM tablename b WHERE a.fieldname = b.fieldname AND a.fieldname2 = b.fieldname2 AND ....so on.. to identify the duplicate rows....)

Cette requête conservera l'enregistrement le plus ancien dans la base de données pour les critères choisis dans le WHERE CLAUSE.

Associé certifié Oracle (2008)

Nick · Answer

Vous devriez faire un petit bloc pl/sql en utilisant un curseur pour loop et supprimer les lignes que vous ne voulez pas conserver. Par exemple:

declare prev_var my_table.var1%TYPE; begin for t in (select var1 from my_table order by var 1) LOOP -- if previous var equal current var, delete the row, else keep on going. end loop; end;

Md Wasi · Answer

DELETE from table_name where rowid not in (select min(rowid) FROM table_name group by column_name);

et vous pouvez également supprimer les enregistrements en double d'une autre manière

DELETE from table_name a where rowid > (select min(rowid) FROM table_name b where a.column=b.column);

Krunal Patel · Answer

create table abcd(id number(10),name varchar2(20)) insert into abcd values(1,'abc') insert into abcd values(2,'pqr') insert into abcd values(3,'xyz') insert into abcd values(1,'abc') insert into abcd values(2,'pqr') insert into abcd values(3,'xyz') select * from abcd id Name 1 abc 2 pqr 3 xyz 1 abc 2 pqr 3 xyz Delete Duplicate record but keep Distinct Record in table DELETE FROM abcd a WHERE ROWID > (SELECT MIN(ROWID) FROM abcd b WHERE b.id=a.id ); run the above query 3 rows delete select * from abcd id Name 1 abc 2 pqr 3 xyz

DoOrDie · Answer

Solution 4)

 delete from emp where rowid in ( select rid from ( select rowid rid, dense_rank() over(partition by empno order by rowid ) rn from emp ) where rn > 1 );

user5906974 · Answer

1. Solution

delete from emp where rowid not in (select max(rowid) from emp group by empno);

2. Solution

delete from emp where rowid in ( select rid from ( select rowid rid, row_number() over(partition by empno order by empno) rn from emp ) where rn > 1 );

.solution

delete from emp e1 where rowid not in (select max(rowid) from emp e2 where e1.empno = e2.empno );

4. Solution

 delete from emp where rowid in ( select rid from ( select rowid rid, dense_rank() over(partition by empno order by rowid ) rn from emp ) where rn > 1 );

Dnyaneshwar Tandale · Answer

Utiliser rowid-

delete from emp where rowid not in (select max(rowid) from emp group by empno);

Utilisation de l'auto-jointure

delete from emp e1 where rowid not in (select max(rowid) from emp e2 where e1.empno = e2.empno );

DoOrDie · Answer

5. Solution

delete from emp where rowid in ( select rid from ( select rowid rid,rank() over (partition by emp_id order by rowid)rn from emp ) where rn > 1 );

user2158672 · Answer

Le moyen le plus rapide pour de très grandes tables

Créer une table d'exceptions avec la structure ci-dessous: exceptions_table

ROW_ID ROWID OWNER VARCHAR2(30) TABLE_NAME VARCHAR2(30) CONSTRAINT VARCHAR2(30)

Essayez de créer une contrainte unique ou une clé primaire qui sera violée par les doublons. Vous obtiendrez un message d'erreur car vous avez des doublons. La table des exceptions contiendra les ID de ligne pour les lignes en double.
```
alter table add constraint unique --or primary key (dupfield1,dupfield2) exceptions into exceptions_table; 
```
Joignez votre table avec exceptions_table par rowid et supprimez les doublons
```
delete original_dups where rowid in (select ROW_ID from exceptions_table); 
```
Si le nombre de lignes à supprimer est important, créez une nouvelle table (avec tous les droits et index) anti-jointure avec exceptions_table par rowid, renommez la table d'origine en table original_dups et renommez new_table_with_no_dups en table d'origine.
```
create table new_table_with_no_dups AS ( select field1, field2 ........ from original_dups t1 where not exists ( select null from exceptions_table T2 where t1.rowid = t2.row_id ) ) 
```

user3655760 · Answer

delete from dept where rowid in ( select rowid from dept minus select max(rowid) from dept group by DEPTNO, DNAME, LOC );

JgSudhakar · Answer

DELETE FROM tableName WHERE ROWID NOT IN (SELECT MIN (ROWID) FROM table GROUP BY columnname);

Rakesh Roshan · Answer

Vérifiez les scripts ci-dessous -

1.

Create table test(id int,sal int);

2.

 insert into test values(1,100); insert into test values(1,100); insert into test values(2,200); insert into test values(2,200); insert into test values(3,300); insert into test values(3,300); commit;

3.

 select * from test;

Vous verrez ici 6 enregistrements.
4.run au-dessous de la requête -

delete from test where rowid in (select rowid from (select rowid, row_number() over (partition by id order by sal) dup from test) where dup > 1)

select * from test;

Vous verrez que les enregistrements en double ont été supprimés.
J'espère que cela résoudra votre question. Merci :)

Darrel Lee · Answer

Je n'ai vu aucune réponse utilisant des expressions de table et des fonctions de fenêtre communes. C'est ce que je trouve le plus facile de travailler avec.

DELETE FROM YourTable WHERE ROWID IN (WITH Duplicates AS (SELECT ROWID RID, ROW_NUMBER() OVER( PARTITION BY First_Name, Last_Name, Birth_Date) AS RN SUM(1) OVER( PARTITION BY First_Name, Last_Name, Birth_Date ORDER BY ROWID ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) AS CNT FROM YourTable WHERE Load_Date IS NULL) SELECT RID FROM duplicates WHERE RN > 1);

Quelques choses à noter:

1) Nous vérifions uniquement la duplication des champs de la clause de partition.

2) Si vous avez des raisons de choisir un doublon plutôt que d’autres, vous pouvez utiliser une clause order by pour que cette ligne ait row_number () = 1

3) Vous pouvez changer le nombre dupliqué préservé en changeant la dernière clause where en "Où RN> N" avec N> = 1 (je pensais que N = 0 supprimerait toutes les lignes comportant des doublons, mais simplement toutes les lignes) .

4) Ajout du champ de partition Sum à la requête CTE qui balisera chaque ligne avec le nombre de lignes du groupe. Donc, pour sélectionner les lignes avec des doublons, y compris le premier élément, utilisez "WHERE cnt> 1".

Enguerrand JORE · Answer

Pour une meilleure performance, voici ce que j'ai écrit:
(voir plan d'exécution)

DELETE FROM your_table WHERE rowid IN (select t1.rowid from your_table t1 LEFT OUTER JOIN ( SELECT MIN(rowid) as rowid, column1,column2, column3 FROM your_table GROUP BY column1, column2, column3 ) co1 ON (t1.rowid = co1.rowid) WHERE co1.rowid IS NULL );

sandeep gupta · Answer

solution :

delete from emp where rowid in ( select rid from ( select rowid rid, row_number() over(partition by empno order by empno) rn from emp ) where rn > 1 );

Ashish sinha · Answer

create or replace procedure delete_duplicate_enq as cursor c1 is select * from enquiry; begin for z in c1 loop delete enquiry where enquiry.enquiryno = z.enquiryno and rowid > any (select rowid from enquiry where enquiry.enquiryno = z.enquiryno); end loop; end delete_duplicate_enq;