2
私は一般的にPythonには新しく、線形回帰モデルを作るのに問題があります。大規模なExcelデータセット(.csv)からトレーニングとテストセットを作成する必要があります。スプリット.csvデータセットから線形回帰モデルを作成する最も良い方法は?
私はすでにデータセットを分割しました:
import pandas as pd
import numpy as np
df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75
training_set = df[split]
testing_set = df[~split]
にはどうすれば平均の平均誤差を用いて線形回帰モデルを作るために、この分割されたデータを使用できますか?
ありがとうございました。 Scikit-learn
で
平均絶対誤差ですか? –