J'ai remarqué que Shotwell avait importé deux fois de nombreuses images (par exemple, depuis la carte SD de mon appareil photo). Apparemment, le la détection des doublons est bogué une fois qu'une photo est importée, étiquetée puis réimportée.
J'ai "écrire des méta-données" activé dans les paramètres. Si j'importe une photo test-images.jpg
et que j'y ajoute des balises, la photo ne sera pas sélectionnée par la détection des doublons lors d'une autre importation du même fichier. La deuxième fois que le fichier est importé, il est nommé test-images-1.jpg
et placé dans le dossier de la bibliothèque conformément aux règles en vigueur (pas nécessairement dans le même dossier).
test-images.jpg
et test-images-1.jpg
auront les mêmes données d'image mais, en raison de la balise/métadonnées ajoutées, les fichiers ne sont plus identiques et ne seront pas récupérés lors de la recherche de doublons (par exemple, hachage md5).
Mon scénario d'utilisation qui a entraîné plusieurs doublons est le suivant:
Comment nettoyer les doublons? Utiliser une recherche basée sur le nom de fichier serait possible mais je ne peux pas exclure le fait que je n'ai pas importé de fichier se terminant par -1
dans lequel n’a pas été importé en double.
Comment puis-je nettoyer ma photothèque? J'ai essayé d'utiliser la fonction de recherche dans Shotwell, mais avec plus de 1000 photos, il doit y avoir une meilleure solution, plus fiable, moins sujette aux erreurs.
Je ne m'inquiète pas de la perte des balises. En général, la deuxième importation (la copie) ne contient aucune balise.
Sorte de spam, mais je me suis retrouvé avec le même problème il y a quelques mois, et j'ai écrit un petit utilitaire qui fait exactement cela:
https://github.com/jesjimher/imgdupes
C'est un script python qui analyse une arborescence de répertoires à la recherche de doublons. Sa syntaxe est intentionnellement similaire à celle de fdupes, à la différence qu'imgdupes ignore toutes les métadonnées et n'analyse que le bloc de données d'image d'un fichier JPEG. Cela signifie que deux versions différentes de la même image, avec des balises différentes, des drapeaux de rotation, des dates, etc., seront signalées comme des doublons même si les fichiers physiques sont différents (et ne sont donc pas détectés comme des doublons par fdupes/shotwell).
Il a récemment été renommé jpegdupes et est maintenant en dépôt Pypi. Vous pouvez donc scanner une arborescence à la recherche d'images dupliquées comme suit:
Sudo pip install jpegdupes jpegdupes -d ~/Photos/
(ou quel que soit votre chemin)
Il s'agirait de fichiers JPEG qui sont en réalité la même image (ne différant que par les métadonnées), et qui montreraient de manière interactive les différences et demanderaient quelle version conserver.
J'espère que ça aide.
J'ai rencontré le même problème il y a quelques semaines. La solution que j'ai trouvée pour résoudre ce problème est simple mais fonctionne: à l'intérieur de Shotwell, effectuez une nouvelle recherche enregistrée qui affiche toutes les images non étiquetées ET dont les noms de fichiers se terminent par "_1.jpg". Vous pouvez ensuite effacer tous les fichiers répertoriés par Shotwell pour cette recherche, mais soyez prudent, faites une sauvegarde avant ;-) Dans mon cas, j'ai supprimé plus de 2000 images!
J'ai rencontré le même problème et résolu en exportant toutes les images de Shotwell dans un autre dossier. Même si vous avez des dupes, Shotwell ne les montre qu'une fois. Par exemple, j'avais 64K dans le dossier mais Shotwell n'a montré que 32K. J'ai donc tout sélectionné et exporté en préservant la taille, le nom, les métadonnées, etc. J'ai tout dans un dossier maintenant. BTW ressemble à ce bogue est corrigé maintenant.
Vous pouvez simplement copier les fichiers étiquetés sur votre téléphone afin qu'ils ne soient plus différents? Je pense que Shotwell devrait faire face à son propre marquage, et cela ressemble à un bug pour moi. J'ai un problème similaire, mais avec Shotwell, il faut re-développer les fichiers Camera Raw à chaque exécution.