ディレクトリをループしてデータフレームを作成

私はデータフレームを作成し、csvファイルで満たされたディレクトリをループしてデータフレームに追加しようとしています。ディレクトリをループしてデータフレームを作成

df = [] 
for dirName, subdirList, fileList in os.walk(rootDir): 
    for fname in fileList: 
     df = pd.read_csv(fname)

は、残念ながら私は（それがない）「ファイルCIN_2017が存在しません」というエラーを取得しています：私は、次のコードを使用しようとしています。これらのcsvファイルをすべてデータフレームに追加する方法についての洞察はありますか？そこに.DS_Storeがありますが、それ以外のものは単なるCSVです。ありがとう。

出典

2017-09-07 user3294779

返信ファイル名の場合はglobで別の解決策を試してから、リスト内包をループインしてlist of DataFramesを作成してください。最後の一つの大きなDFにそれらをconcate：私は同様の問題を抱えている

import glob 

files = glob.glob('files/*.csv') 
dfs = [] 
for fp in files: 
    dfs.append(pd.read_csv(fp)) 

df = pd.concat(dfs, ignore_index=True)

出典

2017-09-07 05:10:31 jezrael

import os 
import pandas as pd 

un_process_file = [] 

master_frame = pd.DataFrame(columns=['item_sku', 'external_product_id', 'standard_price', 'quantity']) 
for root, dirs, files in os.walk(os.getcwd()): 
    for file_path in files: 
     if file_path.endswith('.csv'): 
      try: 
       print file_path 
       file_name = os.path.join(root, file_path) 
       file_frames = pd.read_csv(file_name, skiprows=2, 
              usecols=['item_sku', 'external_product_id', 'standard_price', 'quantity']) 
       master_frame = master_frame.append(file_frames) 
      except: 
       un_process_file.append(file_path) 
master_frame = master_frame.rename(
    columns={'item_sku': 'sku', 'external_product_id': 'asin', 'standard_price': 'price'}) 
master_frame = master_frame.drop_duplicates(subset='asin') 
master_frame.to_csv('masterfile.txt', sep='\t') 
if un_process_file: 
    print '\nUnable To Process these files\n' 
    for files in un_process_file: 
     print files

：

import glob 

files = glob.glob('files/*.csv') 
df = pd.concat([pd.read_csv(fp) for fp in files], ignore_index=True)

同じです。私はこの解決策を作りました。 columnsの名前を必要に応じて変更してください

出典

2017-09-07 05:27:36

ディレクトリをループしてデータフレームを作成

答えて

関連する問題