2016-05-16 4 views
1

私のコードは次のようになります。追加または連結後にパンダのデータフレームに異なるサイズが表示されるのはなぜですか?

import pandas as pd 

candle_data = pd.DataFrame() 

for fileName in files: 
    csv_data = pd.read_csv(fileName, header=None) 
    candle_data = pd.concat([candle_data, csv_data]) 
    #candle_data = candle_data.append(csv_data) 

print(candle_data) 
print(candle_data.tail(3)) 

結果は次のとおりです。

   0  1  2  3  4  5 6 
0  2000.05.30 17:27 0.93020 0.93020 0.93020 0.93020 0 
1  2000.05.30 17:35 0.93040 0.93050 0.93040 0.93050 0 
2  2000.05.30 17:38 0.93040 0.93040 0.93030 0.93030 0 
... 
29781 2016.04.29 16:55 1.14512 1.14524 1.14503 1.14515 0 
29782 2016.04.29 16:56 1.14515 1.14517 1.14491 1.14495 0 
29783 2016.04.29 16:57 1.14494 1.14505 1.14482 1.14482 0 
29784 2016.04.29 16:58 1.14477 1.14511 1.14457 1.14457 0 

[5171932 rows x 7 columns] 
       0  1  2  3  4  5 6 
29782 2016.04.29 16:56 1.14515 1.14517 1.14491 1.14495 0 
29783 2016.04.29 16:57 1.14494 1.14505 1.14482 1.14482 0 
29784 2016.04.29 16:58 1.14477 1.14511 1.14457 1.14457 0 

は、なぜ私は、全体のデータフレームの印刷中ディメンションとして5171932x7得るが、最後の行のインデックスとして29784ましたか? 2つのデータフレームのすべての行をマージする正しい方法は何ですか?

私は duplicatesindexであると思います

答えて

3

意味のインデックスがない場合はconcatにパラメータignore_index=Trueを追加することができます。

pd.concat([candle_data, csv_data], ignore_index=True) 

Docs

+0

はありがとう、私の問題を解決しました! – user1802693

+0

スーパー、あなたがお手伝いできることをうれしい!がんばろう! – jezrael

関連する問題