OCR cenário

Converter de documentos digitalizados e imagens em editável Word, PDF, formatos de saída do Excel e Txt (texto)

Enviar os ficheiros para os reconhecer ou arrastar e largar nesta página

Escolher o ficheiro

ou arrastar e largar o ficheiro

Como reconhecer texto?

Passo 1

Enviar o ficheiro

Selecione o arquivo, que você deseja converter do seu computador, Google Drive, Dropbox ou arrastar e deixá-lo na página

Passo 2

Seleccionar a língua e o formato de saída

Seleccione Todas as línguas utilizadas no seu documento. Escolha também qualquer formato de saída desejado, por exemplo .doc (mais de 10 formatos de texto suportados)

Passo 3

Converter E Transferir

Clique no botão "reconhecer" e, em seguida, baixar o seu ficheiro com o texto reconhecido

Reconhecimento óptico de caracteres

Reconhecimento óptico de caracteres ou leitor óptico de caracteres (OCR) é o eletrônico ou mecânico de conversão de imagens de datilografado, manuscrito ou texto impresso em máquina de texto codificado, seja a partir de um documento digitalizado, uma foto de um documento, uma cena-fotografia (por exemplo, o texto em placas e outdoors em uma foto de paisagem) ou a partir de texto de legendas sobrepostas a uma imagem (por exemplo, a partir de uma transmissão de televisão).

Amplamente utilizado como um formulário de entrada de dados a partir de papel impresso dados de registos - se de passaporte, documentos, faturas, extratos bancários, computadorizado de recibos, cartões de visita, e-mail, impressão de dados estáticos, ou qualquer documentação adequada - é um método comum de digitalização de textos impressos, de forma que eles pode ser editado eletronicamente, pesquisados, armazenados mais compacta, exibidos on-line, e usado em máquina de processos, tais como a cognitiva, a computação, a máquina de tradução, (extraído de texto-para-fala, chave de dados e mineração de texto. OCR é um campo de pesquisa em reconhecimento de padrões, inteligência artificial e visão de computador.

As primeiras versões precisavam ser treinadas com imagens de cada personagem, e trabalhadas em uma fonte de cada vez. Sistemas avançados capazes de produzir um alto grau de precisão de reconhecimento para a maioria das fontes são agora comuns, e com suporte para uma variedade de entradas de formato de arquivo de imagem digital. Alguns sistemas são capazes de reproduzir uma saída formatada que se aproxima da página original, incluindo imagens, colunas e outros componentes não textuais.