CAP-REL OCR labs

Sérendipité technique!

La surprise du jour c'est comment ajouter un calque "texte" au dessus d'une "photo" d'un document PDF issu d'un scanner ... ce que font certains photocopieurs haut de gamme !

Vous pouvez tester directement (modulo les capacités du serveur):

curl -X POST -F "in=@document.pdf" https://k01.cap-rel.fr/pdfplus --output 'document_plus.pdf'

Comparez vos fichiers PDF, l'un est indexable par des outils de recherche texte, l'autre non ...

Indice pour comparer, essayez de sélectionner le texte sur le document avant : impossible, sur le document "après" : possible :-)

Ce serveur n'étant qu'un proto vous trouverez les mentions légales et autres obligations RGPD sur le service principal https://ocr.cap-rel.fr/

© cap-rel 2022