私はリカレントニューラルネットワークを使用して時系列イベント(クリックストリーム)を使用しています。私のデータは、各行がIDのすべてのイベントを含むようにフォーマットする必要があります。私のデータはワンホットエンコードされています。私はすでにIDでグループ分けしています。また、idごとのイベントの総数(例2)を制限するので、最終的な幅は常にわかります(#one-hot cols x #events)。私はイベントの順序を維持する必要があります。なぜなら、時間順に並べられるからです。複数の時系列行を1つの行にまとめます。
現在のデータの状態:
id page.A page.B page.C
0 001 0 1 0
1 001 1 0 0
2 002 0 0 1
3 002 1 0 0
必要なデータの状態:
id page.A1 page.B1 page.C1 page.A2 page.B2 page.C2
0 001 0 1 0 1 0 0
1 002 0 0 1 1 0 1
これは私にpivot
問題のように見えますが、私の結果のデータフレームは、私が必要とする形式になっていません。どのように私はこれにアプローチすべきかに関する提案はありますか?