O Serviço Postal dos EUA usa a tecnologia de reconhecimento óptico de caracteres (OCR ) para ler os endereços em pedaços de correio. Para o e-mail pode ser lido por um e-mail classificador OCR , no entanto, os endereços e as fontes precisam ser formatados de uma certa maneira . Software OCR é útil para converter imagens digitalizadas de documentos manuscritos ou datilografados ao texto eletrônico pesquisável, mas tem desvantagens que limitam suas aplicações. Documentos Limitada
OCR funciona melhor com documentos digitados de boa qualidade . Documentos manuscritos não podem ser facilmente lido pelo software OCR . Da mesma forma, digitado fontes que lembram caligrafia - , bem como as fontes não-latinos - criar muitos erros durante o processo de OCR . Se o documento tiver baixo contraste , é vincado ou sujo, ou o texto eo fundo são semelhantes na escuridão , então OCR pode não funcionar bem . OCR tem dificuldade com documentos que têm imagens e texto . Spreadsheets também irá produzir mais erros.
Precisão
Nenhum software OCR é 100 por cento preciso. O número de erros depende da qualidade e do tipo de documento, incluindo o tipo de letra utilizado . Os erros que ocorrem durante o OCR incluem leitura errada letras , pulando letras que são ilegíveis , ou misturando texto de colunas adjacentes ou legendas de imagem. Se a alta precisão é necessária - como com a conversão de livros em formato digital para eletrônica -, então será necessária uma limpeza do texto eletrônico
Work- Arounds
< br. >
OCR tem dificuldade em diferenciar os personagens , tais como o número zero e um capital " O. " Para contornar esse problema, uma fonte especial de OCR pode ser usado , como escrever fora zero. No entanto, isso só funciona para os documentos criados com OCR em mente , tais como questionários. Ao criar questionários que serão escritas à mão , os pesquisadores também usar caixas para cada letra.
Trabalho adicional
Mesmo que a imagem digitalizada do documento original é de alta qualidade, medidas adicionais devem ocorrer para limpar o texto OCR . É muito trabalhoso para corrigir os erros criados por OCR . A pessoa tem que comparar manualmente o documento original eo texto eletrônico. As pessoas também cometem erros ao digitar o texto de um documento , mas às vezes é mais rápido para pular a etapa de OCR .