名前と組織名のように固有名詞をsmsのような非常に小さな塊から抽出しようとしています.nltk Finding Proper Nouns using NLTK WordNetで利用できる基本パーサーは名詞我々は固有名詞を取得するときに問題が大文字で始まらないさを得るために、このようなテキストのためにSUMITのような名前が適切な名詞(名前と組織)を取得するためにテキストを解析する - python nltk
>>> sentence = "i spoke with sumit and rajesh and Samit about the gridlock situation last night @ around 8 pm last nite"
>>> tagged_sent = pos_tag(sentence.split())
>>> print tagged_sent
[('i', 'PRP'), ('spoke', 'VBP'), ('with', 'IN'), **('sumit', 'NN')**, ('and', 'CC'), ('rajesh', 'JJ'), ('and', 'CC'), **('Samit', 'NNP'),** ('about', 'IN'), ('the', 'DT'), ('gridlock', 'NN'), ('situation', 'NN'), ('last', 'JJ'), ('night', 'NN'), ('@', 'IN'), ('around', 'IN'), ('8', 'CD'), ('pm', 'NN'), ('last', 'JJ'), ('nite', 'NN')]
名前付きエンティティリコグナイザを適用する前にトゥルーキャスティングを試すことができます。 –