複数のファイルからPythonでデータを抽出する

-1

ディレクトリから12個の.txtファイルを抽出しようとしています。各ファイルには、抽出したい3列のデータ（X、Y、Z）が含まれています。私は1つのdf（InforDF）ですべてのデータを収集したいと思いますが、これまでは、同じ列にあるX、Y、Zのすべてのデータを含むdfを作成することに成功しました。これは私のコードです：複数のファイルからPythonでデータを抽出する

import pandas as pd 
import numpy as np 
import os 
import fnmatch 

path = os.getcwd() 

file_list = os.listdir(path) 

InfoDF = pd.DataFrame() 

for file in file_list: 
    try: 
     if fnmatch.fnmatch(file, '*.txt'): 
      filedata = open(file, 'r') 
      df = pd.read_table(filedata, delim_whitespace=True, names={'X','Y','Z'}) 

    except Exception as e: 
     print(e)

私は間違っていますか？

出典

2016-10-04 MichaelSK

を移入するappendかconcatを使用し、ループの前に空のデータフレームInfoDFを作成し、一般的に例外をキャッチしていないが（常にキャッチ特定のタイプの例外） –

各繰り返しでdfを上書きしています –

私はconcatを使用し、その後list comprehensionにDataFramesdfsのリストを作成し、すべてのファイルを選択するためにglobが必要だと思うし、：

files = glob.glob('*.txt') 
dfs = [pd.read_csv(fp, delim_whitespace=True, names=['X','Y','Z']) for fp in files] 

df = pd.concat(dfs, ignore_index=True)

出典

2016-10-04 11:22:45 jezrael

df = pd.read_table(filedata, delim_whitespace=True, names={'X','Y','Z'})

このラインなぜそれがだ、ループの各反復でdfを置き換えますあなたのプログラムの終わりに最後のものしか持っていない。あなたは何ができるか

は、リスト内のすべてのあなたのデータフレームを保存し、

df_list = [] 
for file in file_list: 
    try: 
     if fnmatch.fnmatch(file, '*.txt'): 
      filedata = open(file, 'r') 
      df_list.append(pd.read_table(filedata, delim_whitespace=True, names={'X','Y','Z'})) 
df = pd.concat(df_list)

代わりに最後にそれらを連結することで、あなたはそれを書くことができます。

df_list = pd.concat([pd.read_table(open(file, 'r'), delim_whitespace=True, names={'X','Y','Z'}) for file in file_list if fnmatch.fnmatch(file, '*.txt')])

出典

2016-10-04 11:26:09 JMat

camilleriは、上記に言及したようループ内でdfを上書きしています
また、一般的な例外をキャッチするポイントはありません

ソリューション：発言として小さいdfの

import pandas as pd 
import numpy as np 
import os 
import fnmatch 

path = os.getcwd() 

file_list = os.listdir(path) 

InfoDF = pd.DataFrame(columns={'X','Y','Z'}) # create empty dataframe 
for file in file_list: 
    if fnmatch.fnmatch(file, '*.txt'): 
     filedata = open(file, 'r') 
     df = pd.read_table(filedata, delim_whitespace=True, names={'X','Y','Z'}) 
     InfoDF.append(df, ignore_index=True) 
print InfoDF

出典

2016-10-04 11:40:10 JoshuaBox

複数のファイルからPythonでデータを抽出する

答えて

関連する問題