RからエクスポートしてSegment列をExcelに手動で追加した後、このような生データがあります。他の3つの列の値に基づいてR列の値を設定します
生データは、私は私のためにセグメントを追加しますRのコードを書きたいエクセル
に引っ張りました。
データ記述...ように
ID: Random distinct numbers
flag: Yes or No
Period: 0-12 Mths or 12-24 Mths
Spend Group: High, Medium or Low
ルール...
Flag = Yes
Period = 0-12 Mths
Spend Group = High
Then Segment = G01
Flag = Yes
Period = 0-12 Mths
Spend Group = Medium
Then Segment = G02
Flag = Yes
Period = 0-12 Mths
Spend Group = Low
Then Segment = G03
Flag = Yes
Period = 12-24 Mths
Spend Group = High
Then Segment = G04
...と変数のすべてが
計上されるまで、私はコードをしたいですデータが処理されるたびに差を認識するようにします。たとえば、フラグは常にYesまたはNoになるとは限りません。すべての行でYesになることがあります。
要約した完全なデータセットは、次の図のようになります。
まとめたデータは、
はどのようにRでこれをコーディングを開始しますか?
まず、あなたがして、 '' 'DF <持つデータフレームとしてRにそれを読んで、CSVとして保存したいと思います - read.csv( "C:/Users/you/path_to_file/file.csv") '' '。その後、私はRのチュートリアルを読むことをお勧めします。これは最初に学ぶことの1つです – rsoren
ありがとう@rsoren。私はすでにRのすべてのデータを持っています、これは処理の最後のステップです。上記のものよりも多くの変数がある可能性があるので、ルールを入力する必要はありません。理想的には、各条件に対してベクトルなどを作成し、それらをルールのバックボーンとして使用したいとします。たとえば、フラグ< - c(「はい」、「いいえ」)、直前の< - c(「0-12 Mths "、" 12-24 Mths "など)チュートリアルをお勧めしますか? –
何か試しましたか?ユーザーの1つのキャンプは 'dplyr'パイプラインを提案し、他のキャンプは' data.table'の例と対抗します。おそらく 'ifelse'や他のベクタベースの操作を使って、Rでかなり簡単に行うこともできます。しかし、最初に、私たちが遊ぶデータを持っていれば何かを作るのがはるかに簡単で、イメージから転記する傾向はありません。 [ヘルプ/ mcve](https://stackoverflow.com/help/mcve)と[人気のあるq/a](https://stackoverflow.com/a/5963610/3358272)で良い質問を作成するための良い提案があります。 。 – r2evans