現在、私は情報を抽出したいレポートスタイルのドキュメントを扱っています。現時点では、私は文体をより小さな構成要素に分割しようとしています。個々の分類(このフレーズでどのような情報が期待されていますか)です。報告書が書かれた不正確な文法のため、標準的なconstituency parserは、文の共通根を見つけることができません。これは明らかに依存関係解析のために泣く。しかし、私は、文章の完全な解析を目的としていない選挙区のパーサーが存在するかどうかに関心がありました。最も可能性の高いサブノードを返そうとする確率論的CKYの線に沿ったもの。私は現在、Python nltkフレームワークで作業していますが、Javaソリューションもうまくいくでしょう。完全な解析を目的としていない構成員パーサーはありますか?
0
A
答えて
2
「浅い解析」、つまり「チャンク」を探しているようなサウンドです。ちょうどチャンジャーはあなたの文章中のNP、あるいはNPやVPなどを特定するかもしれません.nltkがすぐに使えると信じていませんが、自分自身を訓練するのはかなり簡単です。 nltk本のChapter 7には、さまざまな種類のチャンクを作成またはトレーニングするための詳細な手順が記載されています。チャンクは、階層構造のビットを必要とする場合でも入れ子にすることができます。
関連する問題
- 1. lxml htmlパーサーが完全なファイルを解析しないのはなぜですか?
- 2. GWTで不正な/不完全なXMLを解析しています
- 3. Javaで完全なLaTeXパーサー
- 4. Haskell JSONパーサーがオブジェクトを解析していない
- 5. 完全なページングはありますか?
- 6. Android XMLパーサーが解析されない
- 7. PHP構文解析エラー:構文エラー、予期しないT_ECHOがあります
- 8. jqueryで完全なhtmlページを解析します
- 9. bs4パーサーは不完全なリストを保持します
- 10. 完全なプロファイラがありますか?
- 11. Python:美味しいスープ:構文解析から完全なタイトルを取得できません
- 12. PythonでHTMLを解析する(HTMLと完全なウェブサイト)
- 13. 私はポインタを完全に理解していないと思いますが、なぜここに出力に違いがありますか?
- 14. Anaconda:完全な環境を作成していませんか?
- 15. サーバタグがうまく構成されていない - RegularExpressionValidator - 構文解析エラー
- 16. 私はElastic Searchを完全に理解しているとは思わない
- 17. R Webページから不完全なテキストを解析する(HTML)
- 18. 動的コード解析ツールと動的テストツールの違いはありますか?
- 19. 完全な* .proファイル構文を持つページはありますか?
- 20. FromJSONは、私はそれを解析することを目的としてい
- 21. CloudCodeを解析できないことがあります
- 22. より効果的な/エレガントな構文解析の設定方法はありますか?
- 23. java saxパーサーで&のエスケープ方法を完全に解析する方法
- 24. は、Lisp:psetfは完全には理解されていない
- 25. はなぜ「はエラー解析:構文エラー、予期しないファイルの終わり...」を取得しています
- 26. 完全にメモリに収まらないファイルを解析する方法
- 27. 総初心者が新しい、完全な、JSONデータで編集ヘルプ構文解析複雑なJSONアレイ
- 28. phpMyAdminをアップグレードした後、 '...構成ストレージが完全に構成されていません...'エラーを有効にする目的は何ですか?
- 29. 'GET-EVENTLOG'は完全なオブジェクトリストを作成し、フィルタリングされますか? - 速い方法がありますか?
- 30. 構文解析エラー:予期しない '{'