O Tagged Image File Format , ou TIFF, serve como uma escolha frequente para salvar arquivos de bitmap sem compressão , incluindo imagens adquiridas a partir de digitalização de material impresso. Você pode criar arquivos TIFF e executar reconhecimento óptico de caracteres em páginas do tipo que você deseja capturar texto como ao vivo. Se o arquivo TIFF não atender às especificações de OCR , o software OCR exibe uma mensagem de erro avisando que o arquivo não pode ser processado corretamente ou em todos. TIFF compressão
O formato de arquivo TIFF permite que você aplique compressão de imagem sem perda quando você salvar documentos em um programa de software que incorpora suporte para esquemas de compressão de arquivos. Essas opções podem diminuir o tamanho do seu arquivo , mas nem todos os programas de OCR suportar tudo, ou qualquer , tipos de compressão TIFF . Para melhores resultados, salvar seus arquivos TIFF sem compressão para torná-los tão fácil de usar quanto possível.
Baixa Resolução
Se você estiver familiarizado com a resolução utilizada para bitmaps em páginas da Web , você pode se perguntar por que um arquivo de 72 pixels por polegada que parece ser bom quando você vê-lo em um navegador da web produz resultados de baixa qualidade em seu programa de OCR . Isso porque o software de OCR precisa de um arquivo que dedica bastante pixels para cada caractere de texto para torná-lo reconhecível pelos algoritmos que processam os exames . Para melhores resultados, você precisa de pelo menos uma varredura de 150 ppi , se não superior. Abrindo uma varredura de 72 ppi e remontando -o a 300 ppi apenas torna o arquivo maior , sem melhorar a qualidade de imagem . Para melhores resultados , comece com alta resolução ou digitalizar novamente para alcançá-lo.
Imagens Crooked
É difícil definir um pedaço de papel para o convés de imagem de um scanner sem a folha à deriva um pouco torto na superfície de vidro liso . Os momentos que você gasta reposicionamento da folha para que você possa obter uma varredura de boa qualidade pagar em melhores resultados de OCR . Mesmo uma nítida digitalização torta coloca uma maior pressão sobre o seu programa de OCR do que aquele que é capturado para cima e para baixo. Para melhores resultados , abaixe a tampa do scanner lentamente para a circulação do ar não vai perturbar o seu papel.
Outras considerações
Dependendo do programa de OCR que você usa, você pode encontrar mensagens de erro porque os arquivos TIFF usar um modo de cor que o seu software de OCR não suporta. Por exemplo, se você capturou um de alta resolução, arquivo RGB de 16 bits para uso em um projeto de retoque , o seu programa de OCR podem recusar o tamanho do arquivo ou a profundidade de bits . Scans de páginas que incluem fotografias ou desenhos ser um incômodo para alguns software OCR, que pode apresentar uma mensagem de erro que reflete o conteúdo da página , e não o formato de arquivo. Finalmente, se a digitalização representa texto em uma folha de papel colorido , você pode ter problemas para capturar o texto porque não tem contraste suficiente contra o seu fundo .