私は、Penn Treebank構造を扱うPythonデータ構造を探しています。これは、ツリーバンクがどのように見えるかのサンプルです:基本的にTreebankのPythonデータ構造
((S
(NP-SBJ (PRP He))
(VP (VBD shouted))
(. .)))
、私はのようなものを求めることができ、データ構造たい「対象NPの子供たちは何を?」 「どのような種類のフレーズが代名詞を支配していますか?」、好ましくはPythonで書かれています。誰かが手掛かりを持っていますか?
ありがとうPraveen。以前は実際にNLTKを扱っていましたが、ここで本当に役立つものは見つけられません。私自身の構造を書く必要があると思っていますが、それは実際にはそれほど重要ではありません。私はコーパスを正しく解析する方法、つまりノードの子どもを識別する方法に苦しんでいます。 – Joko