OCR pour écriture d'enfant?

Répondre
Partager Rechercher
Mon gamin a écrit des histoires sympas que j'aimerais conserver voire partager. J'ai essayé le OCR de mon scanner et celui de Word, et ils ont été infoutus de reconnaître le moindre mot

Est ce qu'il existe des OCR alternatifs (et gratuits) capable de retranscrire l’écriture d'un gosse?
Je confirme, aucun logiciel ne fait ça.

Récemment, on a passé en revue plein de logiciels OCR dans ma boîte, et j'en ai essayé une chiée. Et jamais vu un truc aussi exceptionnel.
Citation :
Publié par Hellraise
OK, bah merci, on va devoir recopier à la main alors
Étonnant que la technologie n'ait pas progressé, je croyais que c'est une mine d'or l'OCR.
C'est une mine d'or, mais j'imagine que la demande pour l'OCR d'écritures manuscrites diminue d'année en année, avec la généralisation de la prise de notes par ordi.

Cela dit, je te rejoins, ce serait génial
A ma connaissance, ia pas eu de révolution dans le monde de l'OCR. Ce qui veut dire que ca fonctionne par entrainement. En gros :
- Le logiciel prend un texte lambda en tant qu'image
- tu "boxes", c'est à dire que tu traces des carrés autour de certaines lettres, plusieurs de chaque, et t'essaie d'etre représentatif, d'avoir toutes les lettres plusieurs fois. Puis pour chaque "box", tu indiques au logiciel : ca c'est un a, ca c'est un c, ca c'est un j, etc.
Et tu fais ca pour chaque police, puisqu'un T en Arial ressemble pas exactement à un T en verdana, etc...

A partir de là, quand tu lui montres un nouveau texte, le logiciel va "boxer" chaque lettre automatiquement. C'est déjà important : ca signifique qu'il va avoir besoin qu'il y ait du blanc entre le noir de chaque lettre. Du coup, une écriture "liée", comme souvent les écritures manuscrites, déjà, ca pose des difficultés.
Ensuite, il prend chaque "box", et il compare avec toutes les références qu'on lui a donné, et cherche ce qui se rapproche le plus. Si il trouve que la lettre n°1 se rapproche de pas mal de I, et d'un peu de J, il va considérer que c'est un I. C'est pour ca que les logiciels d'OCR peuvent facilement se planter entre un 0 et un O sur certaines polices, etc.

Pour améliorer ca, on va pouvoir travailler par exemple avec des dictionnaires : il sait que C0UC0U n'existe pas en francais, donc il va se dire qu'en fait c'est COUCOU. Mais pour ca faut lui préciser la langue, et ca peut l'inciter à se planter sur les noms propres, qu'il connait pas. On peut aussi mettre des "poids" sur les lettres, pour dire que s'il hésite entre un z et un e, ben ia plus de chance que ce soit un e, vu que ca apparait plus souvent. Etc...

Bref, ca reste assez "artisanal" comme technique, surtout avec les moyens accessibles au grand public. Ce qui explique que la détection de manuscrit,c'est rarement top. Et comme, à mon avis, l'écriture d'un enfant est plus variable que celle d'un adulte, ca rajoute de la complexité.
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés