私は2016年の主要選挙結果を持つデータセットを持っています。データセットにはState、state_abbr、county、fips(州と郡のID番号の組み合わせ)、党、候補、票、小数投票の8つの列があります。それぞれの候補者の各郡で「勝ち」または「喪失」を示す「結果」という新しい列を作成したいと考えています。勝者は常に投票の50%を取得していないので、rのデータフレーム内の既存の変数を比較して新しい変数を追加する
Democrat$result <- ifelse(Democrat$fraction_votes > .5, "Win","Loss")
これは、明らかに正確な方法ではありません:私は列を追加し、このコードを使用し、その後、2人の民主的な候補者にdplyrを使用してデータを濾過しました。 Rに各郡のvote_fractionまたは投票総額を比較させ、「勝利」または「損失」を返すにはどうすればよいですか? apply()ファミリ、forループ、関数の作成は、新しい列を作成する最良の方法でしょうか?
state state_abbreviation county fips party candidate
1 Alabama AL Autauga 1001 Democrat Bernie Sanders
2 Alabama AL Autauga 1001 Democrat Hillary Clinton
3 Alabama AL Baldwin 1003 Democrat Bernie Sanders
4 Alabama AL Baldwin 1003 Democrat Hillary Clinton
5 Alabama AL Barbour 1005 Democrat Bernie Sanders
6 Alabama AL Barbour 1005 Democrat Hillary Clinton
votes fraction_votes
1 544 0.182
2 2387 0.800
3 2694 0.329
4 5290 0.647
5 222 0.078
6 2567 0.906
を返し
は、我々はあなたのデータセットの例を得ることができますか? –
あなたの投稿! –
Ok、そこには –