分類/予測問題のために最善の選択をするのに苦労しています。私はタスクを説明しましょう - 私は異なる研究論文の要約からキーワードのデータベースを持っている、また、特定の影響要因を持つジャーナルのリストがあります。私は、キーワードに基づいて記事の分類のためのモデルを構築したい、その結果は、与えられたキーワードとの可能な影響因子(さらなるジャーナル記述なしの数字としてとらえられる)である。一意のキーワードタグは統計的に有意ではないので削除しました。抽象的なリスト(キーワード合計6000回)で2回以上繰り返されるキーワードしかありません。私はダミーコーディングを考えています - それぞれの記事について、バイナリ特徴ベクトル6000の長さの属性を作成します - 各属性は、抽象的にキーワードの存在を参照し、SVMによって全体の集合を分類します。私はこのソリューションが非常にエレガントではないと確信しているでしょうし、おそらくまた正しくないと思います。あなたはよりよい取引の提案をしていますか?スパースデータの分類
0
A
答えて
0
このコーディング戦略をテキストおよびサポートベクターマシンに使用する場合、何も問題はありません。実際の目的のため
:
- サポートベクトル回帰(SVR)は、ジャーナルインパクトファクターに注意
- より適切であり得ます。それは非常に原油です。時間的側面を考慮する必要があります。多くの非常に良い作品は雑誌には全く掲載されていません
関連する問題
- 1. 現在の分類アーカイブページのWoocommerce表示分類分類タイトル
- 2. 文章分類(分類)
- 3. nltk naivebayesテキスト分類用の分類器
- 4. NOテキスト分類のNaive Bayes分類
- 5. Weka + NaiveBayesによる分類分類子+テキスト分類
- 6. 分類リンクは、複数の分類の種類
- 7. Drupal 8 REST分類分類パス
- 8. スタンフォード分類器対ウェカ分類器
- 9. 分類
- 10. 分類
- 11. 分類
- 12. svmの分類
- 13. Wordpressの - 分類
- 14. データの分類
- 15. スパークマルチラベルの分類
- 16. バイナリ分類のためのマルチクラス分類器の訓練
- 17. Drupalの分類ビュー
- 18. PyBrain mnistの分類
- 19. マルチクラス分類のプロット?
- 20. テキスト分類のパフォーマンス
- 21. バイナリ分類のTensorFlow
- 22. Tensorflow - ビデオの分類
- 23. matlabのニューラルネットワーク分類
- 24. 色分類ライブラリ
- 25. リカレントニューラルネットワーク分類
- 26. ナイーブベイズ分類器
- 27. SaaS分類
- 28. 分類ピッカーコントロール
- 29. ケラス:マルチクラス分類
- 30. 分類トレランス