Pode ser muito frustrante para tentar extrair o texto de um arquivo PDF para uso em outro aplicativo. Não é incomum para os gráficos para ficar no caminho ou para o layout do documento para tornar mais difícil para o teste a ser transferido em frases com sentido . Embora não seja impossível extrair o texto com uma abordagem de copiar e colar, que pode ser demorado e não permite texto de arquivos PDF para ser exportado como um formato diferente. Há, no entanto , algumas formas de extrair o texto de um arquivo PDF. Coisas que você precisa
arquivo PDF
Adobe Acrobat Reader
conta do Gmail (opcional)
PDF para software de conversão de texto (opcional)
Mostrar Mais instruções
Extrair Texto Usando Acrobat Reader
1
Abra o arquivo no Acrobat Reader. No Windows , selecione ". Arquivo -> Exportar documento para texto ", o nome do documento e salvá-lo
2
Copie o texto em um Mac ou Linux OS , acessando o menu Exibir e escolhendo " contínuo "ou" contínuo para a frente. " ( O primeiro irá fornecer-lhe com o texto em uma coluna, enquanto o segundo irá formatar o texto como páginas lado -a-lado . ) Vá em " Editar - > Selecionar tudo " e depois em "Editar - > Copiar. "
3
Use a ferramenta Selecionar se só deseja extrair a parte do texto . Clique na ferramenta "Texto Select " e , em seguida, escolher as informações que deseja . Em um documento formatado em várias colunas , você precisará usar a ferramenta "Coluna Select " em primeiro lugar. Vá em " Editar - . > Copiar "
Converter PDF para HTML
4
Use o Gmail como um atalho. Anexe o arquivo PDF para o e-mail e enviá-lo para sua conta do Gmail . Quando você abre o e-mail , você verá uma série de opções ao lado do anexo . Escolha " Exibir como HTML" e salve o arquivo que se abre em uma janela separada . Embora você não será capaz de ver todos os gráficos , o arquivo HTML vai manter a formatação do texto do documento.
5
extrair e converter arquivos na linha de comando . Usuários de Linux podem usar um comando básico de conversão que irá alterar um arquivo pdf em um arquivo txt: . . " . Pdftotext filename.pdf " Certifique-se de substituir o nome do arquivo com o nome do arquivo PDF.
6
download de um PDF para programa de conversão de texto. Há uma série de programas freeware disponíveis, tais como PDFBox e Easy PDF open source e para Conversor de Texto ( ver Recursos abaixo) . Muitos destes programas pode também converter arquivos PDF para HTML também.