私がしたいのは、生の自然なテキストを解析し、日付を表すすべてのフレーズを見つけることです。私は、マークアップされた日付へのすべての参照で、かなり大きなコーパスを持って自然なテキストで日付を参照する方法はありますか?
:
I met him <date>yesterday</date>.
Roger Zelazny was born <date>in 1937</date>
He'll have a hell of a hangover <date>tomorrow morning</date>
私はちょうどそれらを見つけ、日付のフレーズを解釈する必要はありません。日付であるという事実は無関係です(実生活では日付でさえありませんが、詳細であなたを退屈させたくありません)。基本的には可能な限り価値のあるセットです。値そのものの文法は、文脈自由であると近似することができますが、手作業で構築するのは非常に複雑であり、ますます複雑になるにつれて、偽陽性を避けることがますます難しくなります。
これは長いショットであるため、すぐに使用できるソリューションが存在するとは思っていませんが、私は潜在的にどのような技術や研究を使用できますか?
質問を参照してくださいhttp://stackoverflow.com/questions/9294926/how-does-apple-find-dates-times-and-addresses-inails。これは、名前付きエンティティ抽出と呼ばれ、情報抽出のサブタスクとして使用されます。 @reseterはリンクを提供しました。機械学習だけでなく、文法ベースのアプローチもうまくいきます。 –
https://duckling.wit.ai/ – sdream
@sdreamをご覧くださいありがとうございます、これも有望そうです、私はそれを試してみるつもりです。 – biziclop