私は解決しようとしているユニークな問題があります。リスト内のデータフレームをグループ化する
私は、いくつかの異なるタイプの情報を含むデータテーブルを持っています。 例。
私がやろうとしています何ID|inpSeq|Act |User |Representing
--|----- |----|---- |-----
1 | 123 | s | ABC | NA
1 | 124 | s | ABC | NA
1 | 125 | c | ABC | x1
1 | 126 | c | XYZ | x2
1 | 127 | d | ABC | x2
は、「ユーザー」が「Repres」つまり
に関し、私は次の出力
ID|Act |User|....
--|------|----|----|----
1 | sscd | ABC| x1 | x2.....
1 | c | XYZ| x2.....
を作成するために探していますどのように表示してデータを整理することです
元の表が「ユーザー」中心のビューに圧縮され、「Act」にUserが単一IDで実行したすべてのアクティビティが含まれるようになりました。
さらに、私はこのアクティビティを整理していますが、私は(彼らとは異なる場合は)誰が代理を行ったのかを示す必要があります。これは、x1、x2 .....で表されます。これは、各ID/Act/Userの組み合わせに対して固有の「Representing」パーティが存在するかどうかによって、これが大きくなる可能性があることを意味します。
重要なことは、Actフィールドの "s"の値は、Representingフィールドに常にNAを持つことです。したがって、それらのNAでは、変換されたビューに含める必要はありません。
は今、これまで私は、コードのID|Act|User
一部を取得することができた次のコード
aggregate(Act~ID+User, paste, collapse="", data=df)
を使用して考え出したしかし、私は残りの部分を行う方法を把握する必要があります。それが私の助けが必要な場所です。
P.S. "inpSeq"フィールドは、外部アプリケーションによって順番に作成され、正しい順番でアクティビティの順序付けを可能にするユニークな数値フィールドです。データフレームdf
としてあなたのデータで
あなたは、データフレームの単一セルの値の一覧を可能tidyr' 'で' nest'機能を検討する必要があります。 https://blog.rstudio.org/2016/02/02/tidyr-0-4-0/をご覧ください。 –