2017-07-30 13 views
0

ウェブサイトからジッパーノートにデータセットを直接ロードしたいのですが、python pandas 'read_csv'を使用してデータセットをアップロードしようとするたびに、データセットがインポートされますデータセットから列を選択することはできません。ここでIndexError:サイズ2の軸1のインデックス2が範囲外です

は私のコードです:

url = "http://ww2.amstat.org/publications/jse/datasets/fishcatch.dat.txt" 
df = pd.read_csv(url, sep= '\t', header= 0) 

print df 

     1  1  242.0  23.2 25.4 30.0 38.4 13.4 NA 
0  2  1  290.0  24.0 26.3 31....     
1  3  1  340.0  23.9 26.5 31....     
2  4  1  363.0  26.3 29.0 33....     
3  5  1  430.0  26.5 29.0 34.... 

この私がデータセットに

df[:,2] 

IndexErrorTraceback (most recent call last) 
<ipython-input-27-910d22bca5b5> in <module>() 
    ----> 1 df[:,2] 

IndexError: index 2 is out of bounds for axis 1 with size 1 

を3列にアクセスしようとしたとき、私はpythonの2 jupyterをコーディングし、使用に新しいです取得エラーノート。これで何らかの助けをいただければ幸いです。

+0

「iloc」が必要です。 'df.iloc [:、2]' – Psidom

答えて

0

あなたのデータは、単純にタブが分離されていないようです

df = pd.read_csv(url, delim_whitespace=True, header=0) 

を使用し、あなたのデータフレームをロードします。 pandasはデータを適切に解析しないため、すべてが最初は単一の列にダンプされます。

さらに、第三列にアクセスするために、あなたはdf.iloc[:, 2]を使用する必要があります。

関連する問題