NLTKのようなNLPツールキットを作成したい場合、トークン化と正規化の後に最初に実装する機能があります。 POSタギングまたはLemmatisation?実装の順番はどれですか:POSタギングまたはレミメーション?
1
A
答えて
2
品詞は、言葉の種類によって異なる意味を持つ単語として機能するために、漢字化が機能するために重要です。そして、この情報を使って、字形化は基本形や補題を返します。したがって、POSタギングの実装が最初に行われる方が良いでしょう。
字句解析の主なアイデアは、単語の異なる形式を1つにグループ化することです。例えば、は、行く、行く、とは、になります - はになります。しかし、これを導出するには、単語が名詞か動詞かにかかわらず、単語の文脈を知る必要があります。
したがって、言語化関数は単語と品詞を入力として補題を返します情報を処理した後
2
確かにPOSタグャーを作成してください。あなたが字句解析を最初に行うと、ポルトガル語のように、特にあいまいさが一般的である言語で、POSタグャーを実行するときに可能な限り最高の単語の分類を失う可能性があります。
関連する問題
- 1. Weka POSタギング+トークン化
- 2. POSタギングとレムマタイザー用の多言語NLTK
- 3. @PostConstructまたはonloadの順番はどれですか?
- 4. Androidで感情分析(POSタギングなど)を行うことはできますか?
- 5. スタンフォードPOSタガーで複数のタギングを取得
- 6. POSタギングの前にストップワードフィルタリングを使用する必要がありますか?
- 7. JBehaveシナリオはストーリーファイル内で順番に実行されますか?
- 8. スタンフォードPOSタガーが中国語のテキストをタギングしない
- 9. NLTKのPOSタギングのための最大分類子の反復回数を変更するにはどうすればよいですか?
- 10. xUnit.netでは、テストを順番に実行できますか?
- 11. Backbone.jsコンパレータ関数は、どのように降順を実装できますか?
- 12. 正しい順番は? ECDHはECDHの前またはECDHの後に実行されますか?
- 13. MonoDevelop:マクロまたは実行中のコマンドを順番に
- 14. メソッドの実装を宣言の順番に従ってソートするには
- 15. 「万セント」はどのように実装されましたか?
- 16. shiny htmlOutputのループは、順番に実行されません
- 17. フォーマット番号はMS .net xpathの実装でサポートされていますか?
- 18. XNAはどの言語で実装されていますか?
- 19. Pythonでの辞書の順番はどうですか?
- 20. JUnitはテストケースを順番に実行しますか?
- 21. P番目の順列のPrologの実装
- 22. 同じスコープ内のbeforeEachブロックは順番に実行されますか?
- 23. OutputStreamの実装はどこですか
- 24. Amazonデバイスファーム - @テストは順番に実行されていません
- 25. インデックスの順番は重要ですか?
- 26. これらの機能を順番に実行するにはどうすればよいですか?
- 27. ネストされたノード・フェッチ・コールはどのように実装できますか?
- 28. send()はOpenMPIでどこに実装されていますか?
- 29. Djangoマネージャの順番はどのような機能ですか?
- 30. マッピングはDozerで順番に行われていますか?
lemmatizationを手助けするためにPOSタグをどのように統合できるかを少し説明してください。 – Djokester
確かに、私は答えを更新しました、あなたが探していたものかどうか確認してください –