Le Laboratoire

Passer un document numérisé dans un format compatible avec le ctrl-f

Répondre
Partager Rechercher
Pour résumer: mon règlement de copropriété est un pdf qui est la numérisation via scanner du document original, ça donne un truc comme ca:
copro.jpg

Evidemment, impossible de faire une recherche dedans avec l'outil sauveur de l'humanité, à savoir ctrl+F.
Je cherche donc s'il existe un outil permettant de "traduire" le document en un format adéquat parce que je me sens pas de me taper à la main la recopie intégrale du truc.
Si c'est gratuit, c'est mieux.
T'as un OCR google gratuit je crois. Qui est parait il de l'avis de professionnels plutôt performant.
(optical character recognition)
Il y'en a certainement d'autres gratos. Vus que les caractères sont imprimés avec une police standard tu devrais avoir un taux de reconnaissance excellent. Par contre ça fera sauter toutes les mises en page tu obtiendras un texte brut avec probablement quelques coquilles, ponctuations incongrues, corrections mineures à faire (à moins que les technos aient bien progressé, alala on rajeunit pas). Mais pour une recherche ctrlF ça suffira largement.

A partir de ton image tu ne peux pas faire grand chose d'autre. Si tu as les originaux (ou des copies papier) tu peux numériser dans un PDF ou les recherches ctrl+F sont possibles. J'imagine d'ailleurs que le logiciel applique un OCR en même temps qu'il procède au scan pour l'obtenir. Je pense que la plupart des logiciels de scan intègrent cette fonction donc selon le nombre de pages c'est peut être aussi simple de rescanner. Tu dois même pouvoir le faire avec un smartphone + applis gratos mais là c'est carrément de la science fiction pour moi.
(par contre j'ai oublié le nom du format PDF qui le permet ... PDF-A ? peut être)

Dernière modification par Don Patricio ; 10/11/2021 à 11h07.
Citation :
Publié par Linou
Essaie les sites d'OCR gratuit en ligne ?
Exemple pris au pif :
https://www.onlineocr.net/fr/
Y'a généralement des limites de nombre de pages qui sont un peu casse-burnes. Mes docs font 60 pages minimum.
Je n'ai pas les originaux non.

Edit: Google marche pas trop mal si le document est propre, mais les vieux machins de 1979 passent très mal. (Les actes originaux, les suites ne sont que des modifications)

Dernière modification par Lolmao the Dong ; 10/11/2021 à 11h39.
Theoriquement ça doit être possible de rescanner à partir d'une source numérique et cette fois-ci avec la reconnaissance de caractères intégrée.
Faut trouver le logiciel de pilotage de scanning ou d'OCR qui prévoit ça... mais ça doit exister.
Sinon tu trouves un logiciel ocr gratuit sans limites ça doit exister aussi et sinon je te donne pas de conseils illégaux mais de vieilles versions de logiciels pro ça se trouve easy. Il y a aussi les versions d'essai... (Abbyy était performant de mon temps). Une version 2010 ou même 2005 de tels logiciels suffira amplement pour ton besoin.

Dernière modification par Don Patricio ; 10/11/2021 à 11h49.
J'ai pas besoin d'un rendu pro c'est juste pour m'y retrouver dans le souk du règlement de copro et ses modifications/addendums sans y passer 3h à chaque fois.
Le souci c'est que le vieux docu original est pas propre, scanné parfois de travers avec de vieilles traces grises, l'original a manifestement été tapé à la machine.

Screenshot_38.jpg

Je comprends que le logiciel y retrouve pas ses petits
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés