私はUnicode文字で英語以外のパーサーに取り組んでいます。そのために、NLTKを使うことにしました。NLTK文脈自由文法の制作
しかし、それは以下のように事前に定義された文脈自由文法を必要とします。私のアプリで
S -> NP VP
VP -> V NP | V NP PP
PP -> P NP
V -> "saw" | "ate" | "walked"
NP -> "John" | "Mary" | "Bob" | Det N | Det N PP
Det -> "a" | "an" | "the" | "my"
N -> "man" | "dog" | "cat" | "telescope" | "park"
P -> "in" | "on" | "by" | "with"
は、Iは、ルールベースの文法を使用してハードコーディング最小限にすることが出来るのです。 たとえば、-edまたは-ingで終わる単語を動詞として想定できます。したがって、任意のコンテキストで動作するはずです。
どのようにNLTKにそのような文法規則を与えることができますか?または、Finite State Machineを使用して動的に生成しますか?
[この回答](http://stackoverflow.com/questions/14096237/can-someone-give-a-simple-but-non-toy-example-of-a-context-sensitive -grammar/14099421#14099421)は、CFGを作成しているためです。 –
ありがとうございます。私は見ましたが、それを理解できませんでした。 CFGにPython変数を与える方法はありますか? – ChamingaD
CFGルールを自動的に学習したい場合は、次のURLを実装してみてください。www.aclweb.org/anthology/O06-1004 =) – alvas