私は流暢な英語のスピーカーではないので、この質問はネイティブスピーカーにとっては些細なことかもしれません。低脂肪ミルクのような多言語の辞書ですか?
私は自然言語処理システムを実装しています。私はいくつかの別の単語と組み合わせることによって意味を持つ用語を抽出する必要があります。
たとえば、「私は低脂肪ミルクを飲んでいます」から「低脂肪」、「低脂肪」、「低脂肪牛乳」を抽出することになっています。出来ますか?
私は流暢な英語のスピーカーではないので、この質問はネイティブスピーカーにとっては些細なことかもしれません。低脂肪ミルクのような多言語の辞書ですか?
私は自然言語処理システムを実装しています。私はいくつかの別の単語と組み合わせることによって意味を持つ用語を抽出する必要があります。
たとえば、「私は低脂肪ミルクを飲んでいます」から「低脂肪」、「低脂肪」、「低脂肪牛乳」を抽出することになっています。出来ますか?
単語間に構文依存関係を抽出することで、必要なものを達成できます。例えば、ここでは、「低」と「太」は名詞「ミルク」の形容詞である。これらの依存関係が見つかると、必要なものに集中できます。
これらの依存関係を調べるには、Stanford dependency parserを使用できます。これは、Java、Python、およびPHPで利用できます。パーサーhereのオンライン版を試すことができます。
最後に、このpaperは、パーサーとタグの意味を詳しく理解します。
例:あなたは、このようなバイグラムを抽出するためにコロケーション対策を使用することができます
root (ROOT-0 , drinking-3) nsubj (drinking-3 , I-1) aux (drinking-3 , am-2) amod (milk-6 , low-4) amod (milk-6 , fat-5) dobj (drinking-3 , milk-6)
「低脂肪ミルク」と「携帯電話」を「非常に美しい」と区別できますか? – rkjt50r983
はい。そうだろう。 「非常に」はここで「美しい」副詞の修飾語になるからです。 'ルート(ROOT-0、参照-2) nsubj(参照-2、I-1) DET(図-6、a-3) advmod(美しい-5、非常に-4) AMOD(図-6、beautiful-5) dobj(see-2、view-6) ' – TrnKh
:上記の文章については
、あなたは「AMODは」形容詞修飾を意味し、パーサーから次の関係を取得します。トライグラムの仕組みがわからない – lenz