ferramentas de análise de texto existem para os administradores de sistemas e web designers que precisam de procurar grandes quantidades de texto para determinar a estrutura e organização de computadores, scripts do sistema ou documentos mark-up. Os scripts rápida e suja SED e Perl construídos em torno de expressões regulares são muitas vezes suficientes para trabalhos simples , mas a análise de documentos XML complexos exige uma ferramenta mais robusta , como a biblioteca ElementTree da linguagem de programação Python . Coisas que você precisa
Python 2.5 ou superior
Visualizar Mais instruções
um
Iniciar uma sessão de terminal ou , se preferir , abra o Python Integrated Development Environment, conhecido como IDLE, que pode ser encontrado no diretório Python na unidade C (Windows) ou na pasta Applications (Mac). Verifique sua versão do Python digitando python -v no prompt de linha de comando. ElementTree faz parte da biblioteca padrão do Python a partir de Python 2.5 . Se você tiver Python 2.4 ou anterior, você tem que baixá-lo a partir da página principal do Python .
2
Determine o tipo de dados codificados em um documento XML através da leitura da tag raiz. No prompt de linha de comando , carregue ElementTree e sua função de análise com o seguinte comando :
> de importação elementtree.ElementTree parse
3
Localize o arquivo que você deseja analisar e fazer uma nota do seu caminho em relação ao do interpretador Python, ou simplesmente mover o arquivo para a pasta Documentos . Definir uma variável para o arquivo, lê-lo na memória e descobrir o tipo de dados que o arquivo contém o seguinte comando: > árvore = ElementTree ( file = filename) > elem = tree.getroot () > print elem < br >
Isto irá revelar o tipo de dados codificados no documento XML.