2
ごとの行数が異なる多種の変換に長いデータフレーム:私は次の形式を取得する必要がありパンダ私は次の形式でパンダのデータセッションIDの持つフレーム、URLおよびタイムスタンプを持つインデックス
SessionId TimeStamp URL
aa420858 20:24 url1
aa420858 20:26 url2
aa420858 20:27 url3
bb779bc3 18:18 other_url1
bb779bc3 18:21 other_url2
bb779bc3 18:24 other_url3
bb779bc3 18:25 other_url4
zz920853 20:27 diff_url1
zz920853 20:28 diff_url2
:
SessionId URL1 URL2 URL3 URL4 TimeStamp1 TimeStamp2 TimeStamp3 TimeStamp4
aa420858 url1 url2 url3 20:26 20:27 20:27
bb779bc3 other_url1 other_url2 other_url3 other_url4 18:18 18:21 18:24 18:25
zz920853 diff_url1 diff_url2 20:27 20:28
セッションごとに多数のURLを事前に知ることはありません。
私はpd.melt、pd.pivot_table、pivot()、unstack()などを使用しようとしましたが、成功しませんでした。誰かが最善の方法をアドバイスしてもらえますか?また、タイムスタンプの差を使ってページの時間を取得することは可能でしょうか?
ありがとうございました!
グレート時間の
df.groupby('SessionId').cumcount().add(1)
DIFFに感謝を
.add(1)
を追加することができます!スタンプ間の時間差を取得して各URLに時間を持たせる簡単な方法でしょうか?あなたが期待される出力を示す場合 – ibarant@ibarantは私が – Wen
:-)を助けることができると思います '\t TimeStamp1 \t TimeStamp2 \t TimeStamp3セッションID \t TimeStamp4'' bb779bc3 'aa420858 \t' ' 'zz920853 \t \t – ibarant