生データ:サポートベクターマシン - 記事の人気を予測する - 何が間違っているのですか?
記事の内容とタイトル。 10000件の記事
特徴:タイトルの言葉の(私はデータからそれらを抽出)
数は、物品の言葉の
数のFacebookの
数
がお好き公開期間:週末かどうか
まず、私はMLには非常に新しいと言っておきます。
私はSVMでモデルを構築するために必要なデータを使用しようとしています。このモデルは、記事が人気があるかどうかを予測します。 トレーニングデータを使って5Dマップ(4つのフィーチャと4つのフィーチャの4つのディメンションとバイナリの人気情報の1つ)を作成しました。各記事とその特徴は5D空間に点を持つでしょう。
私はSVMでこの5Dマップを使用して、最適なマージンを作成しようとしています。
次に、このマージンを使用してテストデータの人気を予測します。
実装に関しては、私は非常に固執しています。
何か間違っていますか?この問題でSVMをどのように使うべきですか?
何か助けていただければ幸いです。ありがとうございました!
SVMの実装に使用している言語/ソフトウェアおよびカーネルはありますか? – ode2k
@ ode2kカーネルとして線形多項式とガウス関数を使うことを望んでいます。言語は今のところmatlabです – user4751640