Supposons qu'il existe une colonne de valeurs numériques comme suit:
Fichier1:
1
2
3
3
3
4
4
4
5
6
Je veux la sortie:
3
4
Autrement dit, seules les lignes répétées. Existe-t-il des outils de ligne de commande pour le découvrir sous Linux? (NB: les valeurs sont triées numériquement).
Vous pouvez utiliser uniq(1)
pour cela:
uniq -d file.txt
Cela imprimera uniquement les doublons. Le fichier d'entrée doit être trié de telle sorte que tous les doublons soient consécutifs (ce qu'ils semblent être), alors exécutez-le d'abord par tri s'il ne l'est pas.
Exécutez ceci: Perl -ne 'print if $a{$_}++' filename.txt
uniq
nécessite que votre liste soit ordonnée, triez les valeurs par défaut par ordre alphabétiquesort | uniq -d path/to/your/filename
ou
cat fileName | sort | uniq -d path/to/your/filename
Utilisation de uniq
et awk
:
cat File1 | uniq -c | awk '$1 > 1 { print $2 }'