É impossível copiar o texto de um PDF para o Word sem que ele seja reconhecido. Aqui está o porquê:
*
PDFs são projetados para portabilidade de documentos, não editando. Eles armazenam conteúdo de uma maneira difícil de editar diretamente.
*
OCR é a chave para a extração de texto. Quando você copia o texto de um PDF, seu computador está usando o reconhecimento óptico de caracteres (OCR) para converter as imagens de letras em texto editável.
Aqui estão algumas razões comuns pelas quais o texto pode parecer "irreconhecível" na palavra depois de copiar de um pdf: *
o pdf foi digitalizado. Se o PDF foi criado digitalizando um documento em papel, o processo OCR pode não ser preciso, levando a erros no texto copiado.
*
Formatação complexa. PDFs com formatação complexa, como colunas, tabelas ou imagens incorporadas com texto, podem causar erros de OCR.
*
fontes não padrão. Se o PDF usar fontes ou fontes incomuns não disponíveis no seu computador, o OCR poderá interpretar mal os caracteres.
O que fazer em vez disso: 1.
Use um conversor pdf para palavras: Ferramentas como Adobe Acrobat Pro, Nitro Pro ou conversores on -line podem lidar com OCR e fornecer uma conversão mais precisa.
2.
copiar e colar diretamente do pdf: Se o PDF foi criado a partir do texto, geralmente você pode copiar e colar diretamente no Word, embora a formatação possa ser perdida.
3.
Salve o PDF como um documento do Word: Muitos PDFs têm a opção de salvar como um documento do Word (.docx), que reterá a formatação e o reconhecimento de texto.
Nota importante: Mesmo com as melhores ferramentas, alguns PDFs ainda podem ter texto que não é perfeitamente reconhecido. Pode ser necessário editar manualmente o texto copiado no Word.