for row in testDF.iterrows(): 

     print("Currently on row: "+str(row)) 


Currently on row 1; Currently iterrated 1% of rows 
Currently on row 2; Currently iterrated 2% of rows 
Currently on row 3; Currently iterrated 3% of rows 
Currently on row 4; Currently iterrated 4% of rows 
Currently on row 5; Currently iterrated 5% of rows 

なぜループを使用して始めていますか?おそらくもっと良い方法があります。必要な場合は、行の総数で割ることができる現在の行のインデックス(行自体とともに)を返す 'enumerate'を使って、進捗状況を簡単に計算できます。 'progress = index/len(testDF)' – DeepSpace


私はジオコーディングされたデータで新しい列を作成しているので、iterrowsループを使用しています。ジオコードできるサービスのほとんどには制限があるため、私のループには0.1秒の遅延が追加されています。 – christaylor




for i, row in testDF.iterrows(): 
     print("Currently on row: {}; Currently iterrated {}% of rows".format(i, (i + 1)/len(testDF.index) * 100)) 


testDF = pd.DataFrame(np.random.randint(10, size=(10, 3))) 
print (testDF) 
    0 1 2 
0 8 1 9 
1 4 3 5 
2 0 1 3 
3 1 8 6 
4 7 4 7 
5 7 5 3 
6 7 9 9 
7 0 1 2 
8 1 3 4 
9 0 0 3 

for i, row in testDF.iterrows(): 
     print("Currently on row: {}; Currently iterrated {}% of rows".format(i, (i + 1)/len(testDF.index) * 100)) 
Currently on row: 0; Currently iterrated 10.0% of rows 
Currently on row: 1; Currently iterrated 20.0% of rows 
Currently on row: 2; Currently iterrated 30.0% of rows 
Currently on row: 3; Currently iterrated 40.0% of rows 
Currently on row: 4; Currently iterrated 50.0% of rows 
Currently on row: 5; Currently iterrated 60.0% of rows 
Currently on row: 6; Currently iterrated 70.0% of rows 
Currently on row: 7; Currently iterrated 80.0% of rows 
Currently on row: 8; Currently iterrated 90.0% of rows 
Currently on row: 9; Currently iterrated 100.0% of rows 

EDI T:length of dfのと同じであるどのようないくつかのカスタムインデックスの値であれば

length of indexによってzipnumpy.arangeと解決策:すべてのiterrows

testDF = pd.DataFrame(np.random.randint(10, size=(10, 3)), index=[2,4,5,6,7,8,2,1,3,5]) 
print (testDF) 
    0 1 2 
2 8 1 9 
4 4 3 5 
5 0 1 3 
6 1 8 6 
7 7 4 7 
8 7 5 3 
2 7 9 9 
1 0 1 2 
3 1 3 4 
5 0 0 3 

for i, (idx, row) in zip(np.arange(len(testDF.index)), testDF.iterrows()): 
    print("Currently on row: {}; Currently iterrated {}% of rows".format(idx, (i + 1)/len(testDF.index) * 100)) 

Currently on row: 2; Currently iterrated 10.0% of rows 
Currently on row: 4; Currently iterrated 20.0% of rows 
Currently on row: 5; Currently iterrated 30.0% of rows 
Currently on row: 6; Currently iterrated 40.0% of rows 
Currently on row: 7; Currently iterrated 50.0% of rows 
Currently on row: 8; Currently iterrated 60.0% of rows 
Currently on row: 2; Currently iterrated 70.0% of rows 
Currently on row: 1; Currently iterrated 80.0% of rows 
Currently on row: 3; Currently iterrated 90.0% of rows 
Currently on row: 5; Currently iterrated 100.0% of rows 

以下のように印刷する方がよいでしょうか? 'print'(現在、行 '、i'、 'iterated through'、100 * i/testDF.shape [0]、 '%') 'となっています。お返事ありがとうございます –


@ RayhaneMama - 私はあなたの作品も多くの可能な方法があると思います。私は 'len(df.index)'を好んでいます。これは最速の方法です。 – jezrael


ここで、 'i'は各行のインデックスです。インデックスに0〜 'len(df)-1'の整数が含まれていても' testDF'がカスタムインデックス値を使用している場合は動作しません。 –


まず(index, row)のタプルを与えます。そう適切なコードが行の数一般的な場合に

for index, row in testDF.iterrows(): 

インデックスではない、それは(これはパンダの電力一部識別子であるが、それはここでPythonでordinar listないように振る舞うように、いくつかの混乱を行いますインデックスは行数です)。そのため、独立した行数を計算する必要があります。私たちはline_number = 0を導入し、それぞれの数字をline_number += 1に増やすことができます。しかし、Pythonはenumerateという便利なツールを提供しています。valueではなく(line_number, value)のタプルを返します。だから我々はそのコードに来る

for (line_number, (index, row)) in enumerate(testDF.iterrows()): 
    print("Currently on row: {}; Currently iterrated {}% of rows".format(
      line_number, 100*(line_number + 1)/len(testDF))) 

P.S.あなたがintegeresを分けると、python2は整数を返します。そのため、999/1000 = 0、あなたが期待していないものです。だからあなたは浮動小数点数を得ることができますか、または整数になるように最初に100*を取ることができます。





for i,row in dftest.iterrows(): 
    if (i+1)//n>percent : 
     percent +=1 
     print (percent, "% realized") 
    dftest.iloc[i] = 2*row #a job