1
ログを読み込み、特定のワークフローの期間を計算しようとしています。パンダの行間のデータフレーム計算
、私は次のコードを使用してやっている期間を計算するためにTimestamp Workflow Status
20:31:52 ABC Started
...
...
20:32:50 ABC Completed
:
start_time = log_text[(log_text['Workflow']=='ABC') & (log_text['Category']=='Started')]['Timestamp']
compl_time = log_text[(log_text['Workflow']=='ABC') & (log_text['Category']=='Completed')]['Timestamp']
duration = compl_time - start_time
と私が得る答えは次のとおりです。
ので、ログを含むデータフレームは次のようになります1 NaT
72 NaT
Name: Timestamp, dtype: timedelta64[ns]
インデックスが違うので、時差が正しく計算されていないと思います。もちろん、私はによって明示的に各列のインデックスを使用して正しい答えを得ることができます:
duration = compl_time.loc[72] - start_time[1]
しかし、これは物事の無粋な方法のようです。同じことを達成するためのより良い方法はありますか?