Portable Document Format da Adobe (PDF) tem sido em torno desde 1993. Porque ele passou por inúmeras revisões e , a partir de janeiro de 2011, está em processo de fusão com a norma ISO 3200 , a estrutura desses arquivos é um desafio de compreender. Estrutura Geral
Stripped às suas raízes, cada arquivo pdf . É uma mistura de texto com alguns elementos binários usados para formatação. Cada arquivo contém um cabeçalho de versão, o corpo do documento e uma tabela de referência cruzada. Essa visão ignora muitos dos detalhes da estrutura do arquivo , mas é melhor para obter uma compreensão global do que está acontecendo.
Header
O cabeçalho define a versão de software que criou o arquivo . Também pode definir o texto eo tamanho da fonte exibida na parte superior do documento.
Corpo
O corpo do documento é , simplesmente, o material que constitui o documento . Isso pode ser qualquer coisa de texto simples até imagens ou até mesmo fluxos de dados , como áudio ou animação. Esta parte do documento também pode conter recursos de segurança para manter o documento seja alterado .
Tabelas de referência cruzada
Estes são como uma lista de endereços dentro do documento usado para localizar os vários elementos que o compõem . Estes podem ser usados para navegar no documento , procurar termos dentro dela, ou até mesmo controlar as alterações feitas a ele ao longo do tempo .
Outras estruturas
. Arquivo pdf contém outras estruturas , tais como instruções de formatação de página , árvores e estruturas organizacionais de objetos. Enquanto que levaria dias para a carne totalmente fora cada um, há uma série de utilitários como canopener PDF (consulte Recursos ), que pode apresentá-los em um formato visual que é mais compreensível.