1
私のコードは次のようになります。追加または連結後にパンダのデータフレームに異なるサイズが表示されるのはなぜですか?
import pandas as pd
candle_data = pd.DataFrame()
for fileName in files:
csv_data = pd.read_csv(fileName, header=None)
candle_data = pd.concat([candle_data, csv_data])
#candle_data = candle_data.append(csv_data)
print(candle_data)
print(candle_data.tail(3))
結果は次のとおりです。
0 1 2 3 4 5 6
0 2000.05.30 17:27 0.93020 0.93020 0.93020 0.93020 0
1 2000.05.30 17:35 0.93040 0.93050 0.93040 0.93050 0
2 2000.05.30 17:38 0.93040 0.93040 0.93030 0.93030 0
...
29781 2016.04.29 16:55 1.14512 1.14524 1.14503 1.14515 0
29782 2016.04.29 16:56 1.14515 1.14517 1.14491 1.14495 0
29783 2016.04.29 16:57 1.14494 1.14505 1.14482 1.14482 0
29784 2016.04.29 16:58 1.14477 1.14511 1.14457 1.14457 0
[5171932 rows x 7 columns]
0 1 2 3 4 5 6
29782 2016.04.29 16:56 1.14515 1.14517 1.14491 1.14495 0
29783 2016.04.29 16:57 1.14494 1.14505 1.14482 1.14482 0
29784 2016.04.29 16:58 1.14477 1.14511 1.14457 1.14457 0
は、なぜ私は、全体のデータフレームの印刷中ディメンションとして5171932x7得るが、最後の行のインデックスとして29784ましたか? 2つのデータフレームのすべての行をマージする正しい方法は何ですか?
私はduplicates
が
index
であると思います
はありがとう、私の問題を解決しました! – user1802693
スーパー、あなたがお手伝いできることをうれしい!がんばろう! – jezrael