2017-07-14 4 views
-1

私は手術機械の性能を分析しています。制御パラメータには、燃料流量、温度、振動、湿度などの多くが含まれます。評価パフォーマンスの結果には、成功または失敗という2つの値があります。私は、制御パラメータと性能結果との間に相関(または相関)があるかどうかを判断したいと考えています。この問題に分類または回帰を使用する必要がありますか?どのモデルを使うべきですか? ありがとうございます。パフォーマンス離散値に分類または回帰モデルを使用する必要がありますか?

答えて

3

これは、一連のパラメータを成功または失敗として分類することを学びたいので、分類の問題です。

相関関係については、データをPandasデータフレームに読み込んでdf.corr()を実行することができます。これは、変数の相関関係を示します。

モデルに関しては、scikit-learnのNearest NeighborクラシファイアまたはSupport Vector Machineを使用できます。 scikit-learnのライブラリには、棚の実装がありません。

これらのパラメータの将来の値を予測する場合は、回帰が使用されます。

-1

は、あなたがこの場合 を分類方法を使用することができます(失敗、成功)を分類するためにあなたがしたい場合は、データの一部を使用して訓練して、目に見えない(テスト)のデータを用いて予測します。

いくつかの方法:

LinearDiscriminantAnalysis (LDA)

LinearSVC

SVC in general

あなたは変数間の相関を探求したい場合は、のような他の方法で使用することができます。

Spearman correlation

あなたはパンダを使用している場合は、名前のDFにデータをロードすることができますlink hereモジュールが言うと、次に使用することができます:

df.corr() 

変数間の相関関係を取得するには。

P.S:データをアップロードした場合は、例を挙げることができます。

+0

ありがとうございます。ここにデータをアップロードする方法がわかりません。私はpyに慣れていません。あなたがPythonを使っていたにもかかわらず、R. – Levan8421

+0

@ Levan8421を使っています。それでも、あなたは回帰などを検索するだけでRのすべてを行うことができます。 [リンク](http://www.statmethods.net/stats/regression.html) – sera

関連する問題