Que puis-je utiliser pour rechercher des photos en double, y compris des photos redimensionnées?
Ajoutez toutes les photos à votre collection. Dans le menu, sélectionnez "Outils/Rechercher les doublons". Cela recherchera les doublons dans toute votre collection.
Un outil de ligne de commande. Passez toutes les images que vous souhaitez comparer sur la ligne de commande.
Dans le menu, sélectionnez "Fichier/Rechercher une copie". Faites glisser et déposez les fichiers d’image pour dupliquer la fenêtre. Vous pouvez supprimer des répertoires pour ajouter leur contenu de manière récursive. Pour la comparaison visuelle des images, un menu déroulant contient des options spécifiques, autres que les options par défaut. Le niveau de similarité "personnalisé" permet de limiter les associations uniquement au degré de similitude le plus élevé, mais il doit être défini sur "Préférences" sur 99. Même dans ce cas, cela ne fonctionne pas parfaitement, du moins pour certains types d’images, comme les art. Malheureusement, il ne fournit pas de mécanisme de sélection automatique avec des critères rationnels, tels que la résolution, la date ou autre, la sélection automatique semble ne prendre que la première image trouvée comme référence à préserver. La suppression de nombreuses images peut être extrêmement lente, car elle tente de mettre à jour le nombre de résultats à chaque suppression.
Ces trois outils trouvent des doublons visuels, pas seulement des fichiers octets par octets identiques.
fslint
est un programme graphique capable de rechercher des fichiers en double de tout type par md5sum. Si les images ne sont pas identiques, elles ne seront pas marquées comme des doublons. L'image ci-dessous montre plusieurs fichiers pdf en double dans le répertoire Téléchargements:
Vous pouvez modifier les paramètres de recherche avancée pour rechercher par type de fichier et vous limiter aux images. Pour ce faire, modifiez les "paramètres de recherche supplémentaires" en tant qu'options de la commande find
. Par exemple, ici, je ne cherche que des fichiers *.jpg
(dans le même chemin, uniquement dans mon dossier "Téléchargements":
fdupes
est un outil équivalent basé sur la ligne de commande. Les deux sont disponibles dans les pensions.
Vous pouvez utiliser un outil de ligne de commande appelé fdupes
pour rechercher les fichiers en double (voir man fdupes
pour plus de détails). Je ne connais aucun moyen de trouver des "doublons" qui ont été redimensionnés. Un programme faisant cela aurait besoin d’une sorte d’algorithme intelligent pour analyser le contenu de l’image, car lorsqu’une image est redimensionnée, ses données sont modifiées de sorte que les méthodes traditionnelles de recherche de doublons ne fonctionnent pas.
imgSeek peut trouver des doublons ainsi que des images similaires (il devrait donc être capable de trouver des photos redimensionnées et des photos avec des noms de fichier et des métadonnées différents) et même de rechercher des photos sur la base d'un croquis. Il est disponible dans les versions de bureau et serveur.
Je n'ai pas vraiment essayé moi-même, cependant.
dupeGuru Picture Edition fonctionne absolument bien et vaut la peine d'être essayé.
Ils ont un Launchpad PPA , dupeguru
(nouveau package tout-en-un) ou dupeguru-pe
(ancien package d’édition d’images) peut être installé à l’aide de ces commandes:
Sudo add-apt-repository ppa:hsoft/ppa
Sudo apt-get update
Sudo apt-get install dupeguru
Visipics est une application Windows gratuite pour cette fonction, mais fonctionne parfaitement sous Linux, via wine, bien sûr (c'est mieux que geeqie/gqview en ce qui concerne le tri des doublons (les résultats de geeqie sont absolument "non triables").
Vous pouvez lui demander de sélectionner automatiquement les images en fonction de critères tels que la taille réduite du fichier, le type non compressé, la résolution inférieure (cela ne fera pas le contraire, vous devrez le faire manuellement, ce qui ne serait pas le cas. beaucoup mieux que de le faire sur geeqie, sauf que la sélection ne nécessite pas la tenue Shift/Ctrl), et même prioriser les dossiers (mais la dernière priorité est la priorité des dossiers).
Vous devez cependant faire attention aux liens symboliques - il peut "aléatoirement" choisir de sauvegarder un lien symbolique vers un fichier tout en supprimant le fichier en tant que "copie". C'est une honte.