Ubuntu fornece ferramentas de linha de comando e gráficas para converter arquivos de documento portátil (PDF) em formato de texto . A versão de linha de comando, " pdftotext " , automatiza o processo , incluindo o comando de conversão em um script shell. Desta forma, vários arquivos PDF podem ser alterados ao mesmo tempo . Uma série de opções de linha de comando fornecidas com o comando permitir ações específicas (tais como a conversão de apenas as primeiras páginas ) a ter lugar a cada vez que é executado. Obtenção pdftotext
Obter os pacotes apropriados e comando " pdftotext " das bibliotecas do Ubuntu através do comando : sudo
apt-get install poppler -utils
Assegurar que o pacote instalado corretamente antes de tentar usá-lo.
pdftotext Man Página
Saiba como funciona o comando pdftotext e familiarizar-se com as opções de linha de comando disponíveis . Olhe para a página de manual para o comando digitando " homem pdftotext " no prompt shell de linha de comando e pressione "Enter " . As opções de linha de comando consistir de letras , prefixado por um traço , como "-l" , e todos eles oferecem diferentes funções.
O comando padrão para pdftotext é " pdftotext " (sem aspas) , onde é o nome do arquivo PDF para extrair , como " report.pdf " e é o nome do arquivo de saída de texto, como " report.txt " . Você pode usar qualquer nome de sua escolha .
Batch Conversion PDF
Teste o comando , tentando-o em alguns arquivos PDF individualmente. Se é certo que você pode querer tentar usá-lo em uma série de arquivos PDF em scripts shell para automatizar o processo . Um exemplo de um roteiro típico é mostrado abaixo:
for i in * pdf
que
pdftotext $ i $ i.txt
feito < . br>
Este script leva todos os arquivos PDF no diretório atual e exporta -los com seu nome para um arquivo de texto , por isso " report.pdf " se tornaria " report.pdf.txt "
PDF arquivos protegidos
Alguns PDFs são protegidos ou com senhas ou configurar para evitar a exportação de texto do documento . Esta é uma tentativa de proteger os direitos autorais e se for esse o caso , talvez, é melhor reconsiderar a conversão do ponto de vista legal. Se você tiver a senha para um arquivo PDF, que pode ser passado nas opções de linha de comando para " pdftotext " .