? A capacidade de digitalizar um documento em forma legível por máquina é um poupador de tempo incomparável. Ao invés de digitar novamente o documento e, possivelmente, a inserção de erros de seu próprio país, digitalizá-lo e passar a imagem digitalizada através de um leitor de software pode resultar em um documento editável com um alto grau de precisão em relação ao original. Este processo é chamado de software de reconhecimento óptico de caracteres . Reconhecimento Óptico de Caracteres
reconhecimento óptico de caracteres (OCR) é um processo no qual impresso ou texto manuscrito é mecanicamente ou eletronicamente ler e convertido em uma forma reconhecida por um computador. O processo sofisticado vê as formas das letras e os compara com uma biblioteca de formas similares. Quando uma correspondência é feita , um personagem que representa o padrão é exibido na tela, ou inserido em um arquivo de computador. OCR torna possível para um documento a ser digitalizado e lido por um computador , criando um arquivo que pode ser editado ou postas em prática de outras formas.
OCR Software
O software de computador é usado para implementação moderna OCR . O software tem avançado desde os seus primeiros dias , em que os programas tiveram que ser calibrado para cada fonte única , esperava-se a reconhecer . Ele está disponível em forma independente como um programa especificamente criado para a tarefa , e como um componente em software de digitalização . O advento da Internet e computação em nuvem tem levado ao desenvolvimento de programas de OCR com base na Web , eliminando a necessidade de instalações de desktop ou de servidor individuais .
O processo de reconhecimento
< br >
funções do software de OCR , reconhecendo pela primeira vez a distinção entre as áreas claras e escuras da imagem digitalizada. Como se descobre uma distinção luz - escuro , o software de procura padrões reconhecíveis , como linhas horizontais e verticais , bem como as curvas ligadas ou parciais . Se ele é capaz de reconhecer um padrão como uma letra ou outro caractere , ele procura seu banco de dados para o personagem correspondente em conjunto a linguagem do computador. Em seguida, passa este personagem para o documento ou exibi-lo está montando . Se o software não é capaz de reconhecer um personagem , ele pode fazer o seu melhor palpite ou substituir um caráter alternativo , a fim de manter o processo em andamento.
Possíveis problemas com software OCR
Desde software OCR depende de reconhecimento de padrões, qualquer artefato na página que pode potencialmente afetar esse processo é uma fonte de problemas. OCR funciona melhor quando há uma distinção clara entre os caracteres eo fundo do documento , o ideal é preto no branco. Colorido ou fundos ocupadas que fazem os padrões menos distintivo pode causar problemas. Manchas , rugas e outros danos ao documento pode resultar em reconhecimento de caracteres incorreta também.