Pandas.Series.from_csv（）の出力を理解していない

データが3つのtxtファイル、4列の数字があります。これらを1つのデータフレーム（次元[3、n]にロードする必要があります.nはlenght私はSeries.from_csv（）関数を使用することに決めましたが、私は出力を理解することができません。私はこのコードを書いている：私はもっと奇怪見つける何Pandas.Series.from_csv（）の出力を理解していない

：

names = glob.glob("*.txt") 
for i in names: 
    rank = pd.Series.from_csv(i,sep=" ",index_col = 3) 
    print rank

そして、これは私に私のデータの1列（良いのthats）だけでなく、このようなゼロを1列埋め全体を印刷

[0 0 0 ..., 0 0 0] 
[0 0 0 ..., 0 0 0] 
[0 0 0 ..., 0 0 0]

：私は

rank = pd.Series.from_csv(i,sep=" ",index_col = 3).values

を使用するとき、私はこれを得ています

これは、このゼロがファイルから読み取られた値であることを意味しますか？それから、最初の列は何ですか？私は多くの方法を試しましたが、私はこれを理解できませんでした。

出典

2016-11-19 wiedzminYo

私はあなたが最初listdfsにすべてDataFramesを追加してからconcatを使用し、フィルタリング列にdelim_whitespace=Trueとusecolsでより一般的なread_csvを使用することができると思う：

dfs = [] 
names = glob.glob("*.txt") 
for i in names: 
    rank = pd.read_csv(i,delim_whitespace=True,usecols=[3]) 
    print rank 
    dfs.append(rank) 

df = pd.concat(dfs, axis=1)

それともsep='\s+'と - セパレータは、任意の空白です：

dfs = [] 
names = glob.glob("*.txt") 
for i in names: 
    rank = pd.read_csv(i,sep='\s+',usecols=[3]) 
    print rank 
    dfs.append(rank) 

df = pd.concat(dfs, axis=1)

list comprehension：

も使用できます。

files = glob.glob("*.txt") 
dfs = [pd.read_csv(fp, delim_whitespace=True,usecols=[3]) for fp in files] 
df = pd.concat(dfs, axis=1)

出典

2016-11-19 12:06:12 jezrael

Pandas.Series.from_csv（）の出力を理解していない

答えて

関連する問題