私は16列(変数)の大きなデータフレームを持っており、条件に応じてサイズ(レコード数)を減らす方法が必要です。 Rの中で誰かがこれを行う方法を知っているのだろうかと思います。繰り返しレコードを削除してRを使って1つだけ残す方法は?
これに基づいてファイルを消去する必要があります。 「従業員ID」、「年」、「月」、および「終了」の列があります。変数「Termed」は、0 = Activeおよび1 = Termedとしてコード化されています。したがって、「従業員ID」ごとに多くの行があります(「終了」列に「1」という値が設定されるまで、会社で働いていた年と月ごとに1つずつ)、またはその特定の「従業員ID」(「終了」列の値はすべて「0」です)、その場合は最後のレコードを保持する必要があります。
要約すると、私はちょうど(Termination = 1)の場合、各従業員IDに対して終了= 1であり、終了しなかった人の最後のレコード(Termination変数のすべての値が「0」)のレコードを持つ。
Rでこれを行う方法はありますか?ご協力いただきありがとうございます。
あなたの問題は本当に良いと言いますが、正に、これは本当にシンプルで基本的な問題です。 YoutubeのRの紹介コースをチェックしてください。 – MLEN
サンプルデータセットを提供してください。 – www