OCR doc
Converti documenti acquisiti e immagini in formati di output modificabili come Word, PDF, Excel e TXT (texte).
Comment effectuer la reconnaissance de texte?
Importez le fichier
Veuillez choisir la langue et le format de sortie souhaité.
Transformer et télécharger.
La reconnaissance optique de caractères (OCR)
La reconnaissance optique de caractères, également appelée lecture optique de caractères (OCR), consiste en la conversion électronique ou mécanique d'images de texte, qu'il s'agisse de texte dactylographié, écrit à la main ou imprimé, en un texte codé à la machine. Cette conversion peut être réalisée à partir d'un document numérisé, d'une photo d'un document, d'une photo d'une scène (par exemple le texte sur les panneaux et les panneaux d'affichage dans une photo de paysage) ou à partir du texte de sous-titres superposé à une image (par exemple à partir d'une émission de télévision).
L'OCR est largement utilisé pour saisir des données à partir de documents papier imprimés tels que des passeports, des factures, des relevés bancaires, des reçus, des cartes de visite, du courrier, des impressions de données statiques et toute autre documentation appropriée. Il s'agit d'une méthode courante pour numériser du texte imprimé afin qu'il puisse être édité électroniquement, recherché, stocké de manière plus compacte, affiché en ligne et utilisé dans des processus informatiques tels que l'informatique cognitive, la traduction automatique, la synthèse vocale, l'extraction de données clés et l'exploration de texte. L'OCR est un domaine de recherche en reconnaissance de formes, en intelligence artificielle et en vision par ordinateur.
Les premières versions de l'OCR nécessitaient des images de chaque caractère et fonctionnaient avec une police à la fois. Les systèmes avancés qui permettent une reconnaissance de haut niveau pour la plupart des polices sont désormais courants, avec le support de divers formats d'entrée pour les fichiers d'image numérique. Certains systèmes peuvent produire une sortie formatée qui ressemble à la page d'origine, avec des images, des colonnes et d'autres éléments non textuels.