シークレットが初めてで、複数の連続するデータ列に基づいて値を予測する方法を学ぶ必要があります。ここでは、次のような連続データを持ついくつかのデータ列があります。シークレットを使用して連続データの値を予測する
ColA, ColB, ColC, ColD, ColE
8.0 307.0 130.0 3504.0 12.0
15.0 350.0 165.0 3693.0 11.5
18.0 318.0 150.0 3436.0 11.0
16.0 304.0 150.0 3433.0 12.0
17.0 302.0 140.0 3449.0 10.5
15.0 429.0 198.0 4341.0 10.0
14.0 454.0 220.0 4354.0 9.0
14.0 440.0 215.0 4312.0 8.5
....
....
私が行う必要があるのは、上記のデータを供給することによって作成されたモデルに基づいてColAの値を予測することだけです。予測値の分類の例のみを示しています。 ColB、ColC、ColD、ColE値のいずれか/すべてが与えられた場合の実際の値の取得方法
誰でもこの方法でscikitでやってくれるのですか?
を支援しますデータを使用してモデルをフィッティングするには、predict()メソッドを使用して予測を取得します。あなたに私に例を挙げてもらいたいのですか?はいの場合はデータをアップロードできますか? – sera
ありがとうございました。ここにいくつかのコードスニペットを置くことができれば助かります。私は表形式の構造にデータをロードする方法を知っています。私はメソッドに合うように渡されたパラメータとそれをコーディングする正しい方法と混同しています。すべてのデータがsample_dataという構造体にロードされているとします。 ColB、ColC、ColD、ColEのサブモデルをXとして、ColAをyとして渡す必要がありますか?予測のために価値を渡すには? – IndikaU
はい、これは正しいアプローチです。私は数分でいくつかのコードを投稿します。 XとYは配列でなければなりません。また、pandasモジュールは、データのロード/分割に本当に役立ちます。あなたが投稿したデータを使って簡単な例を作成します。 – sera