Detectando substantivos em Python exige as habilidades de um programador e um linguista . A própria linguagem Inglês coloca armadilhas para o lingüista computacional intrépido com sua rica ambigüidade morfológica. Por exemplo, a palavra " atravessa " poderia ser um substantivo plural ou uma terceira pessoa no tempo presente verbo. Felizmente, os criadores do Natural Language Toolkit Python Módulo desenvolveram um pegador part-of -speech que é responsável por essas dificuldades e pode marcar as palavras de frases em inglês com as respectivas partes do discurso , incluindo substantivos. Coisas que você precisa
Python 2.4, 2.5, ou 2.6
Natural Language Toolkit Módulo Python
Mostrar Mais instruções
O 1
baixar e instalar o módulo Python Linguagem Natural Toolkit do site do projeto ntlk.org . Você pode precisar instalar módulos adicionais para apoiar NLTK .
2
Abra uma janela do terminal e iniciar uma sessão de Python Python digitando no prompt da linha de comando. Quando Python está instalado e funcionando , chame o módulo NLTK com o comando de importação NLTK . Os prompts e comandos semelhante a este no Mac OS X :
My- MacBook -Pro : ~ PNA1 $ python Python 2.6.1
( R261 : 67515 , 24 de junho de 2010 , 21:47 : 49)
[ GCC 4.2.1 (Apple Inc. construir 5646 ) ] on darwin
Type " help" , " copyright", " credits " ou "licença" para mais informações.
>>> import nltk
>>>
3
Chame a parte de pegador fala e digite a frase em que você deseja detectar substantivos digitando os seguintes comandos e dados no prompt do Python:
>>> text = nltk.word_tokenize (". o homem atravessa a rua para vender cruzes " ) < br >
>>> nltk.pos_tag (texto)
4
Pressione a tecla de retorno após >>> nltk.pos_tag (texto)
[ ,"(' a ', ' DT ' ), (' homem ', ' NN ' ), (' atravessa ', ' VBZ ' ), (' a ', ' DT ' ), (' rua ', ' NN ') , (' a ', ' TO' ), (' vender' , 'VB ' ), (' atravessa ', ' NNS ') , ('.' , '.') ]
>> >
NLTK foi marcado corretamente cada palavra na frase. Em particular, detectou os substantivos e marcou -os substantivos como singulares com NN (homem , rua ) e substantivos no plural com NNS (cruzes ) e marcou corretamente a primeira ocorrência de cruzes como um verbo com o VBZ tag.