0
SVMは、2つのクラス間のハイパープレーンを描画して2つのクラス間のマージンを最大化しようとする幾何学的アルゴリズムです。これは数字をデータポイントとして理解できます。しかし、データがテキストの場合、マージンとハイパープレーンがどのように決定されるのか分かりません。 SVMがテキストを扱う方法の例を誰かが与えることができれば、私は感謝しています。SVMはテキストデータのマージンをどのように決定しますか?
SVMは、2つのクラス間のハイパープレーンを描画して2つのクラス間のマージンを最大化しようとする幾何学的アルゴリズムです。これは数字をデータポイントとして理解できます。しかし、データがテキストの場合、マージンとハイパープレーンがどのように決定されるのか分かりません。 SVMがテキストを扱う方法の例を誰かが与えることができれば、私は感謝しています。SVMはテキストデータのマージンをどのように決定しますか?
一般に機械学習では、テキスト入力は、テキストデータと対応する数値の辞書に変換されます。リンゴ、オレンジ、バナナの3つの単語がコーパスにあるとしましょう。 1
オレンジ:2
バナナ:辞書は
りんごのように見えるかもしれませんので、あなたが渡す3
1、モデル2、3及びテキストデータときに数値をバックに変換あなたはあなたの結果を得る。たとえば、2の結果が何とか得られれば、それはオレンジを意味します。
内部では、ほとんどの機械学習アルゴリズムは数字のみで動作します。だからあなたのテキストは何とか数値表現に変換されてから処理されます。 –