OCR, qui sont les meilleurs pour reconnaître le texte acquis par les scanners ou les smartphones
Technologie OCR (acronyme de Reconnaissance optique de caractères) vous permet de détecter les caractères qui composent tout document enregistré en tant qu’image et de les transformer en texte modifiable, en préservant parfois également la mise en page du document d’origine.
Les programmes OCR peuvent être utilisés à la fois pour rendre le texte numérisé ou les documents photographiés avec un smartphone modifiables, à la fois pour intervenir directement sur le contenu des fichiers PDF.
Lorsque vous travaillez avec des fichiers PDF envoyés par des collaborateurs, des employés et des collègues, en fait, vous vous rendez souvent compte que les pages sont constituées uniquement d’images de feuilles de papier numérisées. Le document PDF n’est donc utilisé que comme un « conteneur » alors que les informations acquises par le scanner ne peuvent pas être sélectionnées ou copiées ailleurs.
OCR pour smartphone avec objectif Office, Adobe Scan et Google Keep
Commençons par dire que si vous souhaitez transformer instantanément une page papier en texte modifiable en utilisant uniquement votre smartphone, vous pouvez utiliser des applications spéciales qui intègrent la fonctionnalité OCR.
Le plus petit en termes de fonctionnalités mais aussi le plus rapide à utiliser est Google Keep.
En sélectionnant Prendre une photo ou alors Choisissez une image dans Google Keep, vous pouvez d’abord acquérir une photo d’une page imprimée; en cliquant sur le bouton en haut à droite représentant trois points dans la colonne puis sur Récupérer le texte de l’image, le contenu de l’image sera entièrement soumis à la reconnaissance optique des caractères (OCR).
Comme expliqué dans l’article Google Keep: pour gérer les rappels et les notes, avec OCR et reconnaissance vocalecependant, le texte reconnu par le module OCR sera du texte brut, « à partir du Bloc-notes », sans conserver la mise en forme du document.Lentille de bureau est Adobe Scan Au lieu de cela, ils offrent de bien meilleurs résultats en créant des fichiers PDF à partir de photos de documents capturées à l’aide de l’appareil photo de l’appareil mobile.
La photo est automatiquement optimisée et insérée dans un fichier PDF. Chaque zone de texte du document, une fois OCRed, devient sélectionnable et peut être copiée ailleurs.
Nous avons présenté Office Lens et Adobe Scan, respectivement, dans les articles Numériser des documents avec Android: le nouvel Office Lens arrive est Numérisez un document depuis votre smartphone avec Adobe Scan.
OCR en ligne avec SmallPDF
Parmi les solutions qui offrent les meilleurs résultats à ce jour, il y a certainement SmallPDF: cet outil offre des résultats exceptionnels même avec des documents PDF caractérisés par une mise en page complexe avec des textes (police rare) et de nombreuses images. L’avantage de SmallPDF est qu’en accédant à cette page puis en sélectionnant PDF à Word le document est d’abord analysé, il est OCR puis transformé au format Word.
Si le fichier PDF contient des pages avec des images numérisées, donc sans texte sélectionnable, le fichier Word que SmallPDF va produire vous permettra de sélectionner et de copier ailleurs tout ce qui vous intéresse.
Reconnaissance optique des caractères avec IceCream PDF Converter
Dans le passé, nous avons présenté l’excellent dans les pages de IlSoftware.it Éditeur PDF IceCream un éditeur complet qui vous permet d’apporter directement des modifications sur le contenu des documents PDF: Modifier des PDF existants avec l’éditeur IceCream.
Le programme est très bon (d’ailleurs il est totalement gratuit) mais souffre d’un inconvénient: il manque un module OCR. Éditeur PDF IceCream il ne parvient pas à rendre les textes contenus dans les documents numérisés sélectionnables et copiables ailleurs.
Vous pouvez également utiliser IceCream PDF Converter qui intègre la fonctionnalité OCR.
Le programme est également distribué dans une version gratuite qui souffre cependant de certaines limitations par rapport à la version Pro.
Lorsque vous ouvrez un document numérisé au format PDF, Convertisseur PDF IceCream reconnaîtra la présence d’images contenant du texte et proposera l’activation de l’OCR.
Solution gratuite: PDF-XChange Editor
L’immortel Éditeur PDF-XChange offre un ensemble de fonctionnalités plutôt restreint lorsqu’il s’agit de modifier le contenu d’un PDF (alors que Éditeur PDF IceCream est actuellement «roi» parmi les logiciels libres) mais se distingue par ses compétences en OCR.
La procédure à suivre pour convertir les images en texte à partir du contenu du fichier PDF est très simple: il suffit tout d’abord de télécharger et d’installer PDF-XChange Viewer, de charger le package de reconnaissance OCR de la langue italienne en prenant ce fichier puis de double-cliquer sur l’exécutable qu’il contient.
Après avoir lancé PDF-XChange Viewer et ouvert le document PDF contenant les images des feuilles de papier numérisées, vous pouvez cliquer sur le menu Document, numériser des pages de texte avec OCR et définissez les différentes options comme indiqué sur la figure.
Une fois la reconnaissance optique de caractères terminée, choisissez simplement Fichier, enregistrer sous et enregistrez le fichier PDF sous un autre nom. En ouvrant le fichier avec n’importe quel lecteur de fichier PDF, vous remarquerez comment les différentes parties du document seront sélectionnables et copiables ailleurs.
Convertisseur WPS PDF en Word avec fonctionnalités OCR gratuites
Une alternative valable est le peu connu Convertisseur WPS PDF en Word que nous avions présenté il y a quelque temps dans l’article Convertir un PDF en Word, quels programmes utiliser.
Convertisseur WPS PDF en Word vous permet de transformer des fichiers PDF en Word modifiable, mais contrairement à d’autres programmes, il vous permet d’utiliser la fonctionnalité OCR sur les images des documents numérisés.
Avec un clic sur Paramètres vous pouvez spécifier des informations supplémentaires sur la mise en page du PDF et indiquer sur quels éléments la reconnaissance optique de caractères (OCR) doit être activée.
Dans la version gratuite Convertisseur WPS PDF en Word peut convertir des documents de 5 pages maximum en Word.
Mention spéciale pour gImageReader qui est simplement un l’extrémité avant graphiques pour le célèbre moteur OCR Tesseract.
Programmes OCR commerciaux pour Windows
Parmi les meilleurs logiciels OCR commerciaux pour l’environnement Windows, il existe des programmes tels que FineReader, Omnipage Ultimate et Readiris.
Déjà présentés dans nos autres articles, ils intègrent plus de 100 dictionnaires en différentes langues, dont certains sont spécialisés pour des textes sur des sujets techniques, juridiques ou médicaux.
FineReader, par exemple, est livré avec un éditeur d’images, un éditeur PDF et un module capable d’analyser les captures d’écran. L’excellent OCR a une vaste gamme de possibilités, exporte les fichiers au format e-book et reconnaît les langages de programmation.
Omnipage Ultimate minimise les erreurs de reconnaissance optique des caractères et utilise des dictionnaires spécialisés pour le droit et la médecine tout en intégrant de nombreuses options pour le traitement automatique des documents. L’interface utilisateur peut être grandement améliorée et est un peu déroutante.
Readiris est capable de bien séparer les tableaux et les textes lors de la numérisation de documents à condition que les zones individuelles aient été préalablement marquées. Pour obtenir une bonne reconnaissance, les paramètres par défaut doivent être ajustés manuellement.
Autres OCR pouvant être installés sur les appareils Android
Parmi les meilleures applications Android équipées de la fonctionnalité OCR, nous mentionnons OPRA – OCR en temps réel. Il permet de reconnaître les textes contenus dans les documents en temps réel: il n’est pas nécessaire d’enregistrer localement des photos et des documents de dizaines de pages peuvent être numérisés en les transformant en PDF avec texte interrogeable en quelques minutes.
Rapide et précis c’est aussi Objectif intelligent qui, contrairement à OPRA, nécessite une connexion Internet active et fonctionnelle.
L’application est également capable de reconnaître et de trier les URL et les numéros de téléphone dans des listes spécialement créées. La reconnaissance de texte ne fonctionne bien qu’en mode en ligne. De nombreuses fonctionnalités ne peuvent être utilisées qu’en achetant la version Prime à 1,39 euros.
Parmi les meilleures applications pour Android, il y a aussi Fée du texte qui reconnaît correctement 70 langues hors ligne. L’application traite les documents multi-colonnes en douceur et n’affiche pas de publicités ennuyeuses. Il n’y a pas de version Prime.
Découvrez encore plus d’articles dans nos catégories windows, productivité ou encore Ordinateurs et internet.
Au final Merci pour votre visite on espère que notre article OCR, qui sont les meilleurs pour reconnaître le texte acquis par les scanners ou les smartphones
vous aide, pour nous aider, on vous invite à partager l’article sur Facebook, instagram et whatsapp avec les hashtag ☑️ #OCR #qui #sont #les #meilleurs #pour #reconnaître #texte #acquis #par #les #scanners #les #smartphones ☑️!