トレーニングのためにXとyがどのように参照されているか理解している問題があります。単純なnumpyの配列参照
url = "http://www.xyz/shortDataFinal.data"
# download the file
raw_data = urllib.urlopen(url)
# load the CSV file as a numpy matrix
dataset = np.loadtxt(raw_data, delimiter=",")
print(dataset.shape)
# separate the data from the target attributes
X = dataset[:,0:3] #Does this mean columns 1-4?
y = dataset[:,4] #Is this the 5th column?
私はイムが誤って私のX値を参照すると思う:私は次のようにImはnumpyの配列にロード5つの数値列を持つ単純なcsvファイルを持っています。ここに私が必要としているものがあります:
Xの値の参照の列1-4と私のyの値は、5番目の最後の列です。私が正しく理解している場合は、上記のように配列の0:3の値を参照し、yの値は4を参照する必要がありますが、これらの値は正しくありません。つまり、配列によって返される値はデータの値と一致しません。つまり、1つの列(インデックス)だけオフになります。
あなたは '0:4'(4列を取得する)をします。 – hpaulj