文字列/カテゴリの機能を自動的にエンコードするクラスがlibsvmにありますか?私はlibsvmstringoutcomedatawriterというものを見つけました。上記のコードを使用するエンコードのタイプはどれですか? 1つのホットエンコーディング?libsvmのカテゴリ変数を符号化する
1
A
答えて
0
LibSVMの機能をエンコードする方法は、SVMで使用するカーネルによって異なります。たとえば、SVMで文字列を直接フィーチャーとして使用できるストリングカーネルが存在します。 LibSVM FAQは、LibSVMで使用できる文字列カーネルの実装について説明しています。私もstring kernel implementation in Pythonが見つかりましたが、テストしていません。
カテゴリ機能については、LibSVMで使用可能な標準カーネルで使用できます。カテゴリフィーチャを符号化する一般的な方法は、バイナリフィーチャに変換することです。各カテゴリ値は、特定のフィーチャの値1
として表されます。たとえば、機能color={red, green, blue}
の場合、3つの機能red={0,1}
,green={0,1}
,blue={0,1}
を持つことができます。ガウス/ RBFなどのカーネルは問題なくデータを処理できるはずです。
+0
しかし、このエンコーディングは手動で行う必要がありますか?そして私はPOSタグである機能をエンコードしようとしています。それらの詳細は? –
関連する問題
- 1. バイナリ複数の値を持つカテゴリ変数を符号化する
- 2. ハフマン符号化のトラバーサル符号化
- 3. ルビーと符号化変換
- 4. Cのリストの符号の変化を数える
- 5. アポストロフィを符号化する
- 6. 符号化シルベスターシーケンス
- 7. 符号化ポリラインセパレータ
- 8. スキームランレングス符号化
- 9. 符号化のキャリッジリターン
- 10. バイナリで符号化された符号なしの文字を整数に変換する
- 11. 固定長符号化を生成するハフマン符号
- 12. 符号付き変数と符号なし変数の可変コンストラクタをenable_ifを使って作成する
- 13. パンダ:行の値を符号化する/データフレームを変換する
- 14. 符号変化浮くとバック
- 15. BaseJSのBase64でPGP暗号化バイナリを符号化する
- 16. バイナリランレングス符号化、リセットカウンタ
- 17. ランレングス符号化プログラム
- 18. MIMETextのヘッダーの符号化
- 19. CNContactのプロパティの符号化
- 20. android.util.Base64フラグを符号化/復号化する
- 21. ビット演算子で暗号化クラスを符号化する
- 22. Java URIのポンド記号の符号化
- 23. バイナリストリームのエントロピー符号化
- 24. パラメータ値の符号化
- 25. 符号化なしのビネットエフェクト
- 26. MailSystem.NET件名の符号化
- 27. 再符号化の日付
- 28. 角度の符号化データ
- 29. wavをmp3に符号化するアルゴリズム
- 30. ベクトルフィールドを符号化するカラー
Cleartk libsvmにはibsvmstringoutcomedatawriterクラスがあります。 –