Bon logiciel pour trier des photos ?

Répondre
Partager Rechercher
Bonjour,

Voilà mon "problème" tient sur cette capture d'écran.

J'ai 170 000+ photos a trier , a force de faire ma feignasse et de ne rien ranger, ben mon dossier "non trié" est devenu énorme et il faut que je fasse le ménage.

Le soucis, dans les 170K il doit y avoir au moins 5~10% de dupe, que cela exactement le même fichier, ou alors un autre, avec une résolution différente...

Je recherche donc un logiciel (freeware de préférence, mais pas obligatoire), capable de :
  • Détecter les images qui sont les mêmes, en utilisant une méthode classique (hash par exemple) pour détecter les fichiers exactement identiques
  • Mais aussi une méthode plus avancée qui permettrais de retrouver deux images similaires mais avec une résolution/format différent (je pense que cela soit exister, sachant que pour la musique c'est possible...).
Bon je devrais toujours me taper le tri a la main ensuite, mais si je peux éliminer les dupes çà me faciliterais grandement la tâche, car là je patauge, je regarde une photo, je me dis "merde je l'ai pas déjà vu avant celle là ?" et c'est partit que je re-browse tout le dossier pour essayer de la retrouver etc...

Merci
ptdr tu as atteind un point de non retour là ça va s'accumuler et s'accumuler encore et puis et puis... boum

sérieusement je ne sais pas t'aider

mais tout de même autant de photo ta carte flash doit chauffer
Citation :
Publié par cricri
et ton disque tu l a sauvergarder sur un autre au moins ?
J'ai une backup 1:1 de toute mes donnés

Concernant les liens, merci

J'ai testé mais ce n'est pas ce que je recherche, enfin çà remplis seulement le premier point et çà a la rigueur je peux le trouver ailleurs.

Cela compare juste les tailles / dates, bref si deux fichiers sont strictement identiques, mais il suffit qu'il soit enregistrer dans un autre format (compressé d'une manière différente) ou une autre résolution et le logiciel ne voit plus rien :/
Citation :
Publié par Weïg
Les dupes ont le même nom ? (avec le ( 2 ) derrière )
Non, des noms qui n'ont rien avoir.

Mais le soucis c'est surtout les trucs qui sont en double, mais compressé d'une manière différente (genre un JPEG qualité 80, l'autre qualité 60)... Ou ceux qui ont une résolution différente.

Tout ce qui est nom/date/hash c'est une minorité.

Pour cela que j'ai besoin d'un logiciel plus avancé qu'un truc qui va se contenter de scanner 3 variables :/ (dates / nom / taille).
Acdsee devrait pouvoir t'aider mais il est payant. Il peut rechercher les doublons à conditions que ce soit des doublons exacts càd même résolution, même taille etc.. Si tu as deux fois la même image mais avec des résolutions différentes, il ne les trouvera pas.
Dans ce cas de figure, tu devrais pouvoir comparer les images et supprimer le doublon inutile.
Il intègre également une base de données: tu peux éditer les images avec des mots-clés afin de mieux les organiser pour pouvoir les retrouver plus facilement par la suite.

Le mieux c'est d'essayer leur version d'évaluation pour te faire une idée.

Malheureseument je ne connais pas d'alternatives gratuites à ce logiciel. Ceci dit si quelqu'un a une idée, je suis preneur.
Mh suggestion peut être mauvaise, mais tu ne peux pas convertir toute les photo dans le meme format, puis utiliser un logiciel qui les compare ? Bon certe il va falloir une bonne machine pour faire ce traitement sur toute les tof, mais si ca permet d'avoir exactement les mêmes photo et donc les trier, ca peut peut etre valoir le coup ?
Pictagent fonctionne plutôt bien ( d'ailleurs j'ai pas trouvé mieux ).
Il permet de trouver les doublons, malgré une taille, un format, une couleur différente, etc.
Tout dépend du pourcentage de ressemblance voulu.
En revanche il est plutôt lent, et effacer les doublons est fastidieux mais il est largement plus précis qu'acdsee ( à utiliser en parallèle histoire de dégrossir la chose ).

Par contre il plante si le nombre d'image à trier est trop important ( jusqu'à 35Go ça va, après j'ai pas encore testé ).
Citation :
Publié par Panzerjo MILKS
Mh suggestion peut être mauvaise, mais tu ne peux pas convertir toute les photo dans le meme format, puis utiliser un logiciel qui les compare ? Bon certe il va falloir une bonne machine pour faire ce traitement sur toute les tof, mais si ca permet d'avoir exactement les mêmes photo et donc les trier, ca peut peut etre valoir le coup ?
Si tu enregistres du jpg qualité 60 en jpg 80 ça ne fera pas revenir la qualité, donc tu vas toujours avoir des écarts.


Purée, mais tu as fais comment pour avoir autant de photos aussi mal rangé ?
Mon 350D me les envoient dans un dossier avec le nom du jour, du coup, lorsque je retouche les photos je refais un dossier à l'intérieur que je nomme retouche, et du coup, bah j'ai pas trop d'emmerde. Et si je veux lister toutes les images, je n'ai qu'à faire une recherche.
Citation :
Mh suggestion peut être mauvaise, mais tu ne peux pas convertir toute les photo dans le meme format, puis utiliser un logiciel qui les compare ?
Il faudrait le faire a la main car les photos n'ont pas du tout le même format, y'a une bonne partie de download, donc c'est "libre", des résolutions qui ne veulent rien dire quoi...

Mettre entre deux fichiers d'une même série les résolutions diffères, genre 506x802,558x809,557x804...

Donc pas toujours le même ratio :/

Après concernant la qualité c'est variable là encore, il doit y avoir des qualité 80, qualité 100, qualité 70... Si je compresse tout au même niveau, il y aura de la perte d'espace ou de la perte de qualité et surtout mes fichiers seront altérés.

Pour ACDSee j'ai déjà essayer

Mais bon encore une fois pour les doublons "conformes" un simple hash check et hop. Générer un MD5 pour chaque JPEG, virer les doublons, et voilà. Mais çà c'est simple

----

Par comparaison, pour la musique, il est possible de détecter les doublons, même encoder d'une manière différente, et ce même sans tag.

Certes cela ne marche pas dans 100% des cas (vu qu'il faut passer par une base de donnés), mais j'ai fais des essais avec quelques fichiers, je les ai untag, renommer, compresser d'une manière différente (flac/mp3...), et Winamp arrivait toujours a les retagger. (en utilisant la bdd Gracenote)

Mieux encore, j'ai altéré ces fichiers, par exemple retirer 1 minutes de musique au milieu d'un morceau qui en fait 3 en coupant n'importe comment, les deux fichiers avaient des tailles différentes, un format différent, un bitrate différent, une durée différente, un hash md5 différent, et ils étaient toujours reconnu comme étant identique. (Winamp les re-taggait / même ID Gracenote).

Donc je me dis que si c'est possible pour la musique, c'est possible pour les images, il doit bien y avoir un algorithme qui arrive a trouver deux images qui se ressemblent très fortement, a résolution/compression/format près. Même sans BDD. La BDD sert juste a rapatrié les tags, mais Gracenote analyse le contenu du fichier en lui même pour lui attribuer un ID spécial. Il me faudrait un truc du genre pour les images. Après je compare les fichiers qui ont des ID identiques et je garde le meilleur (en qualité / résolution).

Citation :
Purée, mais tu as fais comment pour avoir autant de photos aussi mal rangé ?
Download en partie, échange etc... Et va s'y qu'une personne m'envoie 1K photo de ci ou de çà, un autre m'envois les photos de tel event, parfois çà inc au compte goûte sur un forum ou un random blogs, MSN, j'en passe.

A force je balançait tout n'importe où, d'ailleurs je faisais toujours des répertoires "temp" (du genre je rangerais demain), puis vient tempp, temppp, tempppp, après y'a trop de "p" alors temp000, temp001....

Et y'a de tout mélangé, du wallpapper que j'ai bien aimé, a un random dessin pris sur DeviantArt, un booklet de CD/jeu, etc... Moins c'est trier plus tu penses ne pas posséder tel ou tel chose, au final tu re-download ailleurs, nouveau nom, autre compression > bordel.

-------

Edit :

Bon je crois avoir trouvé ce que je cherche

Clone Remover !

J'ai fais un petit test, il a réussit a trouver des images similaires, même altérer (j'ai ajouté un petit cercle rouge sous paint), compressé d'une manière différente et de résolution différente.

Je vais lancer la recherche sur les 170K fichiers je verrais bien si c'est concluant.
Citation :
Publié par Antipika
il doit bien y avoir un algorithme qui arrive a trouver deux images qui se ressemblent très fortement, a résolution/compression/format près.
Pictagent le fait très bien ça...comment ça j'insiste. ><
Citation :
Publié par Lahir
Pictagent le fait très bien ça...comment ça j'insiste. ><

J'avais louper ton post Je vais essayer aussi

Edit : bon ben après le scan j'ai vu juste, 14 773 fichiers "inutiles", entre 5~10% des 170K lol :<

Reste plus qu'a trier les 155K restant lol :<
Citation :
Publié par Antipika
J'avais louper ton post Je vais essayer aussi

Edit : bon ben après le scan j'ai vu juste, 14 773 fichiers "inutiles", entre 5~10% des 170K lol :<

Reste plus qu'a trier les 155K restant lol :<
A combien de % ton premier scan ?

Pour ma part je le fais à 95%.

@Ohrido/Cener : de rien, j'ai tellement galéré pour trouver un bon logiciel, autant le partager.
J'ai utilisé Clone Remover, sachant que c'est le premier que j'avais trouver. Et il n'y a pas de pourcentage. J'ai essayer Pictagent mais il est moins intuitif je trouve.

Mes fichiers étant sur un partition TrueCrypt çà avance moins vite que sur une partition normale (2H+...).

Enfin c'était juste pour une fois, je vais tout trier now
Citation :
Publié par Antipika
Et il n'y a pas de pourcentage. J'ai essayer Pictagent mais il est moins intuitif je trouve.
Effectivement il n'est pas très intuitif, mais il reste tout de même très efficace, bien que très long lorsqu'il y a un grand nombre d'images.
Pour ce qui est du pourcentage, je parlais du pourcentage de ressemblance des images ( dans fichier => préférence ).

Je suis toujours à la recherche d'autres logiciels pouvant avoir le même rôle et la même précision que pictagent.
Oui oui j'avais compris Pour cela que j'ai dis que dans clone remover il n'y avait pas de pourcentage.

Enfin je ne fais pas confiance a un logiciel seul pour la suppression de toute manière, je m'en suis juste servis pour avoir une liste des doubles, après c'est moi qui vais juger quel fichier garder, et surtout faire le tri.

Car parfois il y a un fichier dans le set A identique un autre dans le set B, celui dans le set B est de meilleur qualité, mais il aurait plus sa place dans le set A. (en fonction du thème etc...)

Du coup je supprime celui du set A, et je déplace celui du set B vers le set A.

Si je laisse un logiciel faire les choses automatiquement il va se contenter de virer le fichier du set A et laisser celui du set B.

Mais au moins je ne pose plus la question "je l'ai déjà vu cette image ?"
imgSeek s'en occupe aussi je crois (http://www.imgseek.net/sshot/)

imgSeek gere une collection d'image et permet de rechercher une image en dessinant quelques formes avec quelques couleurs etc. J'avais testé, y'a encore du boulot niveau algo (ou moins niveau dessin/artistique) pour retrouver facilement ce qu'on veut, mais par exemple, je me rappellais d'une photo ou un pote etait au milieu d'une photo avec un pull orange, j'ai dessiné une sorte de rectangle orange et un rond brun au dessus (il etait black) et dans la liste de correspondance, la photo y etait )

Sinon, y'a quelques scripts perl ou python qui le font sous linux je crois (findimagesdupe je crois)

Sinon j'ai fait un script qui scanne un repertoire + tous les sous repertoires, et il copie les photos dans un format classique : repertoire de base/année/mois/année-mois-jour_/ suivant les dates de prises indiqué dans les tags EXIF.
du coup j'ai un repertoire en année-mois-jour_ et il me reste a compléter en voyant le contenu du repertoire.
Il faut juste changer la copie en déplacement, et ca evitera de bouffer une place enorme

Autre "souci", je n'ai pas géré les soirées ^^ En gros, toutes les photos prises entre 00H00 et 6H00 d'une journée devrait etre considéré du repertoire du jour d'avant (photos de soirée + after + after after, etc)
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés