スペーシーmodelsは、語彙、構文、エンティティおよびベクトルを含む異なる「タイプ」に関連付けられています。エンティティとベクトルがドキュメントで利用可能なフィーチャにマップされる方法は明らかです(エンティティ認識とワードベクトル)が、テキストを解析した後にドキュメントで使用できるフィーチャとボキャブラリと構文はどのように関係していますか?例えば、多言語モデル「xx_ent_wiki_sm」は「語彙」を提供しないので、そのモデルを使用してトークンのis_oovが利用できなくなることを意味しますか? Spacyの上にさまざまな言語モデルで動作するWebサービスを提供したいので、私はこれを求めています。スペーシーモデルタイプおよび利用可能な機能マッピング
0
A
答えて
1
"構文"は、すべての関連するすべての言語機能とプロパティを解析します。たとえば、token.dep_
,token.head
,doc.noun_chunks
またはdoc.sents
- 本質的には、依存関係の解析が必要なものすべて(概要はsee this page)です。
「語彙」は、Vocab
に最も頻繁に使用される単語があらかじめ入力されていることを意味します。モデルにボキャブが付いていない場合、すべてのトークンは語彙外になり、is_oov
の場合はTrue
を返します。より大きいモデルは、通常、より大きい語彙と共に出荷される。 sm
モデルには、最も頻繁に使用される単語の基本語彙が含まれている必要がありますが、一部のデータが現在設定されている方法に問題がある可能性があります。
関連する問題
- 1. Ember:グローバルに利用可能な検索コンポーネント(およびアクション)?
- 2. タイプセーフアクティベータが利用可能なコマンドラインオプション/機能
- 3. Vue.jsの再利用可能なインクリメント機能とデクリメント機能
- 4. COMPOSE機能および機能モジュール
- 5. 利用可能なフィルタリング利用可能なタスクグループ別のギャラリストタスク
- 6. のOpenMPおよび機能
- 7. PolyML機能およびタイプ
- 8. 機能および方法
- 9. ゴーテンプレートおよび機能
- 10. `this`グローバルコンテキストおよび機能
- 11. 複合クラスの再利用可能な匿名ランキング機能
- 12. Google AdWordsで再利用可能な機能を作成する
- 13. コントローラの再利用可能な機能を置く場所
- 14. フレンドフィードと同様の機能のDjango再利用可能なアプリ
- 15. 利用機能
- 16. Java - 利用可能なガベージコレクションアルゴリズム
- 17. 再利用可能なコントロール
- 18. 再利用可能なプリプロセッサ__COUNTER__
- 19. 再利用可能なコンポーネント
- 20. 利用可能なCRANビネット
- 21. 再利用可能なリモートモーダルレール
- 22. 次利用可能なID
- 23. 再利用可能な、
- 24. 利用可能なデータ
- 25. 再利用可能なコンポーネント
- 26. 再利用可能なビュー?
- 27. どのような新しいブラウザ機能が利用可能ですか?
- 28. ハスケル - System.Process callCommandおよび他の機能は利用できません
- 29. Divsのリストをソート可能およびクリック可能にする
- 30. =>および連鎖可能性=