私は以下のコードを使用しています。すべての私のCSVファイルは一様な構造をしています。データフレームが形成されるとき、私のCSVに日付の2つの列が含まれます。pandasデータフレームを使用したCSVのマージ
結果のデータフレームでは、日付の値は最初の日付の列になり、残りのデータは2番目の日付の列になります。
ソースCSVファイルの1つの列に対して2つの列(日付列)が生成されているという考えはあります。
all_data = pd.DataFrame()
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"):
df = pd.read_csv(f)
all_data = all_data.append(df,ignore_index=True)
In [76]: all_data.columns
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'],
dtype='object')
おそらくいくつかのcsvファイルには、 'Date'カラムにスペースがあります。 –
ありがとう、それは働いた。 – Sarang