Logiciel de recherche au sein de multiples gros fichiers pdf/word

Répondre
Partager Rechercher
Salut à tous,


J'ai énormément de fichiers .pdf, .doc, .docx, au sein desquels je voudrais pouvoir chercher. Mon but, c'est de taper "forums jol" dans un champ de recherche, et d'obtenir une liste de tous les fichiers qui contiennent ces mots. Donc pas uniquement le nom du fichier (pour ça, "everything" de voidsoft est juste parfait et rapide), mais son contenu.

Actuellement, j'utilise filelocator pro, mais je le trouve fort lent dès que les fichiers sont nombreux et/ou font plusieurs centaines de pages, quel que soit le PC.

Auriez-vous des alternatives à suggérer?

La recherche de l'explorateur windows est trop incertaine, je trouve, et est aussi asthmatique en cas de nombreux/gros fichiers.


Bonne journée à tous
Citation :
Publié par Fubinx
google drive est assez costaud dans la recherche dans les documents même ceux scannés en pdf, il reconnait les caractères.
je vais tester ça

Testé, c'est pas mal du tout! Il n'y a pas autant d'infos que dans file locator pro, mais c'est rpaide!
Citation :
Publié par Roytonic
Bonjour

il y a GrepWin très pratique .

http://stefanstools.sourceforge.net/grepWin.html

J'ai testé, mais c'est pour les fichiers texte, non?

Dernière modification par La chance ; 30/07/2017 à 20h17.
c'est de taper "forums jol" dans un champ de recherche

"forum jol" c'est bien du texte ?

GrepWin peux rechercher dans n'importe quelle type de fichier ,même binaire
il trouvera la chaine
Citation :
Publié par Roytonic
c'est de taper "forums jol" dans un champ de recherche

"forum jol" c'est bien du texte ?

GrepWin peux rechercher dans n'importe quelle type de fichier ,même binaire
il trouvera la chaine


Je pense que je n'ai pas les connaissances pour comprendre ce que tu veux dire (chaîne, fichier binaire...)

Moi je voudrais un logiciel qui permet de rechercher au sein du contenu de fichiers .doc, .docx, .pdf, pas uniquement au sein de fichiers texte genre .txt ou .html.
Citation :
Publié par La chance


Je pense que je n'ai pas les connaissances pour comprendre ce que tu veux dire (chaîne, fichier binaire...)

Moi je voudrais un logiciel qui permet de rechercher au sein du contenu de fichiers .doc, .docx, .pdf, pas uniquement au sein de fichiers texte genre .txt ou .html.

Bien GrepWin le fait sans aucun problème dans tout type de fichier

( Chaine = suite de mot a rechercher )
Citation :
Publié par Roytonic
Bien GrepWin le fait sans aucun problème dans tout type de fichier

( Chaine = suite de mot a rechercher )
Merci pour ta réponse.

Es-tu certain que ça fonctionne avec ces fichiers? J'ai essayé sans succès, et cette page

https://sourceforge.net/p/grepwin/tickets/350/

semble confirmer que Grepwin n'est pas destiné à ça
Réponse tres tardive , 8 ans après
Citation :
Publié par La chance
Merci pour ta réponse.

Es-tu certain que ça fonctionne avec ces fichiers? J'ai essayé sans succès, et cette page

https://sourceforge.net/p/grepwin/tickets/350/

semble confirmer que Grepwin n'est pas destiné à ça
Bonjour

J'ai regarder la réponse que tu as cité , je vois dans la photo , que GrepWin est mal configurer
la case qui est cocher c'est pour les expressions régulières (Regex search) et non pour la recherche de texte
(Text search) , alors bien sur GrepWin ne va rien trouver
PS: Il faut aussi cocher Include system items, Include binary files, et Include hidden items
de plus les dernières version son en français que l'on peux choisir dans la configuration de GrepWin

https://tools.stefankueng.com/grepWin.html

Bonne Journée
Citation :
Publié par La chance
Salut à tous,


J'ai énormément de fichiers .pdf, .doc, .docx, au sein desquels je voudrais pouvoir chercher. Mon but, c'est de taper "forums jol" dans un champ de recherche, et d'obtenir une liste de tous les fichiers qui contiennent ces mots. Donc pas uniquement le nom du fichier (pour ça, "everything" de voidsoft est juste parfait et rapide), mais son contenu.

Actuellement, j'utilise filelocator pro, mais je le trouve fort lent dès que les fichiers sont nombreux et/ou font plusieurs centaines de pages, quel que soit le PC.

Auriez-vous des alternatives à suggérer?

La recherche de l'explorateur windows est trop incertaine, je trouve, et est aussi asthmatique en cas de nombreux/gros fichiers.


Bonne journée à tous
Windows le fait, de base.
Par défaut l'indexation ne tient compte que du type de fichier et de son nom.
Tu peux modifier l'indexation pour qu'elle tienne compte de leur contenu (et tu peux faire ça selon le type, par exemple uniquement sur les pdfs et pas sur les word).
Citation :
Publié par Linou
Windows le fait, de base.
Par défaut l'indexation ne tient compte que du type de fichier et de son nom.
Tu peux modifier l'indexation pour qu'elle tienne compte de leur contenu (et tu peux faire ça selon le type, par exemple uniquement sur les pdfs et pas sur les word).
Je viens de tester. Quand je cherche sur un DD avec approximativement 350 Go de fichiers, ça ne fonctionne pas bien du tout. Tu as des réglages pour que ça fonctionne?

Heureux que tu aies fait remonter, je vais retenter Grepwin aussi!
Je viens de tester Grepwin sur un simple dossier contenant une vingtaine de fichiers docx et pdf (en utilisant les paramètres indiqués ci-dessus), puis windows explorer.

J'ai tapé le mot "libre", dont je sais qu'il apparaît dans un des fichiers.

Grepwin ne trouve pas le pdf en question, l'explorateur windows non plus, mais filelocator pro le trouve.

Je vais continuer à creuser, peut-être que je m'y prends mal.
Tire la langue
Grepwin la suite
Citation :
Publié par La chance
Je viens de tester Grepwin sur un simple dossier contenant une vingtaine de fichiers docx et pdf (en utilisant les paramètres indiqués ci-dessus), puis windows explorer.

J'ai tapé le mot "libre", dont je sais qu'il apparaît dans un des fichiers.

Grepwin ne trouve pas le pdf en question, l'explorateur windows non plus, mais filelocator pro le trouve.

Je vais continuer à creuser, peut-être que je m'y prends mal.
Bonjour

Les 2 fichiers que tu cite avec l'extension pdf et docx son des fichiers compresser ( je veux dire que le texte n'est pas en clair dans un éditeur standard ex: bloc-notes ), donc a moins d'avoir un décompresseur intégrer il ne peux pas trouver la chaîne de caractères ,je vais regarder comment procède filelocator pro
bonne journée a tous

Filelocator Pro à un decompresseur intégrer
Ensuite il y a le prix d'un coté GrepWin gratuit, de l'autre coté
Filelocator Pro la licence standard 79 $ et un an de mise a jour gratuite

Dernière modification par Roytonic ; 02/04/2025 à 11h46. Motif: Le prix , lol
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés