2012-04-26 2 views
4

NLTK名前付きエンティティタグを使用して、さまざまな名前付きエンティティを識別しようとしています。本書ではPythonでの自然言語処理には、DATE June、2008-06-29とTIMEの2つの50分、1:30 p.m.を含む一般的に使用される名前付きエンティティのリストが提供されています(誰かが好奇心を持っている場合は、表7.4)。だから、NLTKの名前付き実体タグ・タグでこれを行うことができたという印象を受けました。名前付きエンティティとして日付を認識するためにnltkを使用しますか?

しかし、私がタガーを実行したときに、人や組織と同じように、日付や時刻を一切受け取っていないようです。 NLTKという名前のエンティティ・タグは、これらの日付/時刻のケースを処理しませんか、特定の日付/時刻形式のみを取得しますか?これらのケースを処理できない場合は、誰でもシステムを知っていますか?または、私自身の唯一のソリューションを作成していますか?

ありがとうございます!

答えて

10

あなたはNLTKののcontribリポジトリをチェックアウトする必要があります - timex.pyと呼ばれるモジュールが含まれているか、それをここでダウンロード:モジュールの最初の行から https://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

 
# Code for tagging temporal expressions in text 
+0

これが見事に動作します。ありがとうございました! – greatblue

+1

明示的な日付と時刻でうまく動作しません。たとえば、 'June 23rd、2016' – lenhhoxung

+0

@lenhhoxungもっと良い解決策はありますか? –

関連する問題