2017-12-20 23 views
0

SVMの使用のポイントは、アルゴリズムが入力が真か偽かなどを判断できるということです。サポートベクターマシンモデルはどのくらい具体的にするべきですか?

予測保守にSVMを使用して、システムの可能性を予測しようとしています。オーバーヒート。

私の例では、範囲は0-102℃です。温度が80℃以上になると、故障として分類されます。

私の入力は30倍(最後の30回の読み)の配列です。

私はSVMを訓練するためにいくつかのサンプル入力をしていますが、訓練のために非常に特定のデータを渡すことがよいかどうか疑問に思っていました - 例えば、80℃、81℃... 102℃モデルは自動的にこれらの値を失敗と関連付けます。あなたは30×79℃のアレイを行うこともでき、それを通過するように設定することができる。

このような配列を入力すると、これは完全な方法ですが、温度が80℃〜102℃のときにスイッチ文をハードコードするのと同じではありません。

これらの「ハードコードされた」スタイルの配列を渡すことをお勧めしますか、もっとランダムな入力に固執する必要がありますか?

+0

これは不明瞭で幅広いです。さらに、サンプルの測定値がある時間tで測定された温度である場合、それらの測定値を渡してSVMを使用することは、MLの観点からは意味をなさない。 – sascha

+0

しかし、間違いなく可能です。上記のように、これは分類アルゴリズムを使用するには奇妙な問題のように思えます。特にあなたが結果を望むので、フロートである可能性は、私は推測しています。 – Alien13

+0

@サシャ私の質問スキルを批判するのではなく、私が尋ねようとしていた質問に答えていただければ幸いです。 – Andre

答えて

1

有限の可能性がある場合は、Naive Bayesを使用することをお勧めします。その方法は、この問題に完全に適合します。しかし、あなたがSVMを使用することを余儀なくされたら、それはむしろ難しいと思います。まず最初に、SVMの主なアイデアは、分類のためにそれを使用することです。シナリオの量は実際問題ではありません。入力はほとんど離散しないので、通常無限のシナリオがあると思います。しかし、普通に実装されているSVMは、100%のクラスを1%、別のクラスを2%としない限り、あなたに分類を与えません。これは本当に問題を解決しません。

結論として、これは機能する可能性がありますが、「ベストプラクティス」とはみなされません。あなたの30次元のベクトル空間を100の小さな部分空間に分割し、各データポイントを30×1のベクトルがそのベクトル空間内の点になるように想像して、その確率が100個の部分集合のうちのどれによって決定されるかを決めることができます。あまりクリーンでないか不十分なデータであっても、非常に悪い、頑強なモデルにつながります。

乾杯:

関連する問題