2016-09-06 22 views
1

私は以下のコードを使用しています。すべての私のCSVファイルは一様な構造をしています。データフレームが形成されるとき、私のCSVに日付の2つの列が含まれます。pandasデータフレームを使用したCSVのマージ

結果のデータフレームでは、日付の値は最初の日付の列になり、残りのデータは2番目の日付の列になります。

ソースCSVファイルの1つの列に対して2つの列(日付列)が生成されているという考えはあります。

all_data = pd.DataFrame() 
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"): 
    df = pd.read_csv(f) 
    all_data = all_data.append(df,ignore_index=True) 

In [76]: all_data.columns 
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'], 
dtype='object') 
+0

おそらくいくつかのcsvファイルには、 'Date'カラムにスペースがあります。 –

+0

ありがとう、それは働いた。 – Sarang

答えて

5

あなたは2列目のスペースを持っているので:

'Date', 'Date ' 
      ^

ので、あなたが列を正規化する必要がある前に、ここで

all_data = pd.DataFrame() 
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"): 
    df = pd.read_csv(f) 
    df.columns = df.columns.str.strip() 
    all_data = all_data.append(df,ignore_index=True) 

を追加する私は大手を削除するstr.stripを使用し、末尾の空白

+0

ありがとう、私はCSVファイルのいくつかからそれを修正し、それは働いた。 – Sarang

+0

私の答えがあなたの問題を解決した場合、それを受け入れることができます、私の答えの左上に空の目盛りがあります、ありがとう – EdChum

+0

ありがとうもう一度:) – Sarang

関連する問題