チャンク化または浅い解析は、文を構文的構成要素またはチャンクのシーケンス、すなわち言語特性に基づいてグループ化された隣接ワードのシーケンスにセグメント化する。これは、自然言語を解析するための効率的で堅牢なアプローチと呼ばれ、完全な解析の一般的な代替案ですが、シナリオチャンクは完全な解析を行うより適切な方法です。どのようなシナリオで、完全な解析の代わりにチャンクを使用しますか?
0
A
答えて
1
これは私の個人的な偏見以上のものではありませんが、何らかの理由で名詞や動詞のフレーズを検出する必要がある場合は、チャンク化する方がよい場合があります。たとえば、ドキュメントのクラスタリング、トピックのタグ付け、または単純にキーワードの識別のために、NPまたはVPチャンク処理で十分です。また、ツリーバンクが存在しない言語で作業する必要がある場合は、チャンクに戻すこともできます。
チャンク化は、通常、深い解析よりも数倍速いという利点がありますが、現代(パーセプトロン/ニューラル)パーサーは、5〜10年前の深い解析者よりもはるかに高速です。しかし、これまでのところであっても、深い構文解析は長い文章で詰まる可能性があります。明らかに、深いパーサーを訓練するためにツリーバンクに注釈を付けるのは、NP/VP句に注釈を付けるだけでなく、英語以外のテキストで句を検出する必要がある場合にルールベースのチャンクを構築するだけでもコストがかかります。
関連する問題
- 1. 代わりに、完全なエラーメッセージ
- 2. Node.jsでWebページの解析が完了したらどうすればわかりますか?チャンクが正常に印刷なくなり
- 3. Rでの完全な配列を読み、代わりのメンバー
- 4. このシナリオではどのように代理人を使用しますか?
- 5. PostgreSQLの解析にはどのような文法が使われますか?
- 6. は、256ビットのハッシュの代わりに、完全なハッシュ値
- 7. なぜslim.nets.vggは完全接続されたレイヤの代わりにconv2dを使用しますか?
- 8. UpdatePanelはasyncpostbackの代わりに完全なポストバックを返します
- 9. BeautifulSoupを使ったパスの代わりに完全なURLを取得する
- 10. jqueryで完全なhtmlページを解析します
- 11. pythonを使用して完全なファイルの代わりに範囲のバイトを正常にダウンロードするには?
- 12. なぜAssembly.LoadFromの代わりにAssembly.LoadFileを使用しますか?
- 13. `read`関数に代わる完全な方法はありますか?
- 14. XMLTextReaderはどのような解析方法を使用していますか?
- 15. ANDの代わりに&&を使用すると、スクリプトにどのような違いがありますか?
- 16. Pythonコマンドラインスクリプト。使用の2つのシナリオ。どのように引数の解析を実装するのですか?
- 17. 一部のWebアプリケーションでCookieの代わりにETagを完全に使用できますか?
- 18. AJAXは、次のように私のAJAXコードは、完全なJSPファイルの代わりに、戻り値
- 19. より安全で使いやすく柔軟なC++の代わりにsscanf()
- 20. Pythonで__file__の代わりにどのような方法を使用できますか?
- 21. コンテンツ比較にiThenticateサービスを使用する代わりに、どのような方法がありますか?
- 22. Web Scrapping:完全なソースコードの代わりに単一のスクリプトを返す(Pythonリクエスト)
- 23. この完全なシナリオで操作キューを使用する必要がありますか?
- 24. GWTで不正な/不完全なXMLを解析しています
- 25. phpMyAdminを使用する代わりにどのような方法がありますか?
- 26. 構文解析はどのように機能するのですか?型を完全または不完全にする要素は何ですか?
- 27. HTMLの代わりにRegexを使った構文解析
- 28. 不完全なデータファイルのみを転送して、完全なファイルから不完全なデータファイルを更新するにはどうすればよいですか?
- 29. URLの代わりにアプリケーションバンドルからXMLを解析する
- 30. 不完全なrobots.txt、どうなりますか?