2016-05-29 8 views
0

名前のフィルタを作成して、指定したテキストから名前を除外しようとしています。私はStanfordNERとNLTKを使ってこれを行い、実際にこれを行うとタプルを含むリストが得られます。私がやりたいことは、私はちょうどでのみ「アラン」を取得するにはタプルを含む上記のリストから「PERSON」としてタグ付けされた正確な名前を抽出したいということです StanforNERリストの結果に「PERSON」を含むタプルを抽出します

[(u'I', u'O'), (u'met', u'O'), (u'with', u'O'), (u'Alan', u'PERSON'), (u'yesterday', u'O')] 

(以下に示すように)プロセスの終了。助けてください。

答えて

2
weird_list = [(u'I', u'O'), (u'met', u'O'), (u'with', u'O'), (u'Alan', u'PERSON'), (u'yesterday', u'O')] 
for word, tag in weird_list: 
    if tag == 'PERSON': 
     print word 
+0

おかげでニシキヘビのマニュアルを読んでみて完全に働きました。ちょうど私が望んだ方法 –

1
weird_list = [(u'I', u'O'), (u'met', u'O'), (u'with', u'O'), (u'Alan', u'PERSON'), (u'yesterday', u'O')] 
for item in weird_list: 
    if 'PERSON' in item: 
     print item[0] #will return item number 1 of the tuple 

は、Data Structures

関連する問題