A edição de um documento de texto digitalizado, também conhecido como imagem de texto (ou um documento baseado em imagem), requer uma abordagem diferente de editar um documento digital regular, porque não é texto que o computador pode entender diretamente. Você precisa converter a imagem do texto em texto editável usando o reconhecimento óptico de caracteres (OCR). Aqui está como:
1. Digitalize o documento (se você ainda não o fez): Verifique se sua varredura é de alta qualidade; Imagens claras e nítidas produzem melhores resultados de OCR.
2. Use o software OCR: Este é o passo crucial. Existem muitas opções, desde ferramentas on -line gratuitas a aplicativos de desktop poderosos. As escolhas populares incluem:
*
Ferramentas OCR online: Estes são convenientes para documentos pequenos. Exemplos incluem:
*
onlineoc.net: Uma opção gratuita popular e geralmente confiável.
*
newocr: Outra opção online gratuita.
*
Google Drive: O Google Docs pode executar o OCR em imagens carregadas.
*
Software OCR da área de trabalho: Geralmente, são mais poderosos e oferecem melhor precisão, especialmente com layouts complexos ou varreduras de baixa qualidade. As escolhas populares incluem:
*
Adobe Acrobat Pro: Um editor abrangente em PDF com OCR embutido. (Pago)
*
Abbyy FineReader: Um programa de OCR dedicado conhecido por sua precisão. (Pago)
*
TESSERACT OCR: Um poderoso motor de código aberto; Você precisará usá-lo por meio de um programa ou interface de wrapper (por exemplo, o próprio TESSERACT é baseado na linha de comando). (Livre)
3. Execute o OCR: O processo varia um pouco dependendo do software escolhido, mas geralmente envolve:
*
Upload ou importação: Selecione o arquivo de imagem digitalizado (geralmente um JPG, PNG, TIFF ou PDF).
*
Selecionando o idioma: Especifique o idioma do texto para obter melhor precisão.
*
Iniciando OCR: Iniciar o processo OCR; Isso pode levar algum tempo, dependendo do tamanho e da complexidade do documento.
4. Revise e edite a saída OCR: OCR não é perfeito. O software converterá a imagem em texto, mas os erros são comuns. Revise cuidadosamente a saída para:
*
Erros de digitação: Corrija quaisquer erros ortográficos ou reconhecimento incorreto de caracteres.
*
problemas de layout: Ajuste a formatação (parágrafos, títulos, etc.), se necessário.
*
Texto ausente ou ilegal: Se as seções não forem legíveis, pode ser necessário re-varrer essas peças ou usar um software OCR diferente.
5. Salve o documento editado: Salve o documento em um formato comumente usado como .docx (Microsoft word), .rtf (formato de texto rico) ou .txt (texto simples).
Dicas para obter melhores resultados: *
Digitalizações de alta resolução: Quanto maior a resolução, melhor a precisão do OCR.
*
varreduras limpas: Evite sombras, rugas ou outras imperfeições no documento digitalizado.
*
exames preto e branco: Geralmente produzem melhores resultados do que as varreduras de cores.
*
Desake a imagem: Se a imagem digitalizada for inclinada, endireite -a antes do OCR. Muitos programas de edição de imagens podem fazer isso.
*
Escolha o software certo: Para documentos complexos ou grandes volumes de digitalização, recomenda -se um programa de OCR dedicado.
Seguindo essas etapas, você pode transformar um documento digitalizado em um arquivo de texto editável que você pode modificar facilmente usando o software de processamento de texto. Lembre -se de que a precisão do processo OCR afeta significativamente o fluxo de trabalho de edição; Espere gastar algum tempo corrigindo erros.