私は&を解析する必要があります。半構造化されたテキストの大きなセット(基本的に法的文書 - 法文、それらの補遺、条約、裁判官の決定...)。私がしようとしている最も基本的なことは、サブパートがどのように構造化されているか(章、記事、小見出し、さらにいくつかのメタデータ)の情報を抽出することです。私の質問は、誰かがこのタイプのテキスト処理の開始点を指し示すことができるかどうかです。なぜなら、これについて多くの研究が行われていると確信していますが、私が見つけたのは、厳密な文法(コードのような)または完全にフリーフォームのテキスト(Googleがウェブページ上でやりたいような)正しいキーワードを取れば、私はgoogleと私のジャーナルデータベースでもっと成功するだろうと思う。ありがとう。自然言語処理/テキスト構造解析の開始点
1
A
答えて
0
これまでにこれをしたことはありませんでしたが、もし私が行くつもりなら、間違いなくANTLRを調べるでしょう。その非常に人気のあるプロジェクトで、あなたの言語でポートを選ぶことができます。
1
natural language toolkitは興味深いスタートであり、自然言語処理のすべての分野に豊富なリソースがあります。それはおそらくあなたが必要とするよりも言語的に集中しているでしょう。
もう1つの選択肢は、厳密ではない(つまり、必要であれば大きなチャックを無視できるようにする)パーサージェネレータライブラリ(通常はコードに使用される)を使用することです。 Pythonで私はpyparsingをお勧めします。 another answerでは、任意のテキストチャプターを無視したいときにできることの簡単な例を示しました。
関連する問題
- 1. 自然言語の解析
- 2. 自然言語処理データベースクエリ
- 3. 自然言語文構造の検索
- 4. 自然言語処理の構文木の略語
- 5. トピックの自然言語処理
- 6. iPhone用の自然言語処理
- 7. PHPでの自然言語処理
- 8. 自然言語クエリ処理のデータベース
- 9. Javaの自然言語処理ライブラリ
- 10. 自然言語処理 - Truecaserクラシファイア
- 11. Android用自然言語処理
- 12. テキスト分析対自然言語処理違いは何ですか?
- 13. 自然言語処理(syntatctic、セマンティック、progmatic)分析
- 14. 自然言語処理を使用してウェブサイトを解析する
- 15. IBM Bluemix自然言語理解API
- 16. 自然言語コマンド言語
- 17. Python対自然言語処理のためのJava
- 18. 自然言語処理のためのARFF
- 19. Cucumber + Gherkin:自然言語をbooleanに解析します
- 20. 自然言語解析、具体的な例
- 21. 自然言語の識別を解除
- 22. Pythonの自然言語処理(文章参照)
- 23. Google Cloud自然言語処理APIの上限額
- 24. 名前付きエンティティのPython自然言語処理
- 25. apacheを使用した自然言語処理OpenNLP
- 26. サンプルを使ったSharpNLPを使った自然言語処理
- 27. 純粋な統計または自然言語処理エンジン?
- 28. Marklogic機械学習またはNLP - 自然言語処理
- 29. ダイアログ内の自然言語を理解する
- 30. IBMワトソン会話と自然言語理解の違い