OCR cenário
Converter de documentos digitalizados e imagens em editável Word, PDF, formatos de saída do Excel e Txt (texto)
Como reconhecer texto?
Enviar o ficheiro
Seleccionar a língua e o formato de saída
Converter E Transferir
Reconhecimento óptico de caracteres
Reconhecimento óptico de caracteres ou leitor óptico de caracteres (OCR) é o eletrônico ou mecânico de conversão de imagens de datilografado, manuscrito ou texto impresso em máquina de texto codificado, seja a partir de um documento digitalizado, uma foto de um documento, uma cena-fotografia (por exemplo, o texto em placas e outdoors em uma foto de paisagem) ou a partir de texto de legendas sobrepostas a uma imagem (por exemplo, a partir de uma transmissão de televisão).
Amplamente utilizado como um formulário de entrada de dados a partir de papel impresso dados de registos - se de passaporte, documentos, faturas, extratos bancários, computadorizado de recibos, cartões de visita, e-mail, impressão de dados estáticos, ou qualquer documentação adequada - é um método comum de digitalização de textos impressos, de forma que eles pode ser editado eletronicamente, pesquisados, armazenados mais compacta, exibidos on-line, e usado em máquina de processos, tais como a cognitiva, a computação, a máquina de tradução, (extraído de texto-para-fala, chave de dados e mineração de texto. OCR é um campo de pesquisa em reconhecimento de padrões, inteligência artificial e visão de computador.
As primeiras versões precisavam ser treinadas com imagens de cada personagem, e trabalhadas em uma fonte de cada vez. Sistemas avançados capazes de produzir um alto grau de precisão de reconhecimento para a maioria das fontes são agora comuns, e com suporte para uma variedade de entradas de formato de arquivo de imagem digital. Alguns sistemas são capazes de reproduzir uma saída formatada que se aproxima da página original, incluindo imagens, colunas e outros componentes não textuais.