のみNAが利用できない限り、NAはない最新のデータを保管してください:このようになります。今年、都市、値:R - 私は3列のデータセット持って
year = c(2010, 2013, 2010, 2013, 2013)
city = c("Berlin","Berlin", "Munich", "Munich", "Frankfurt")
value = c(1234, NA, NA, 6372, NA)
data <- data.frame(year, value1, value2)
year city value
1 2010 Berlin 1234
2 2013 Berlin NA
3 2010 Munich NA
4 2013 Munich 6372
5 2013 Frankfurt NA
を私はサブセットする方法を知りたいですように、これは私が最後に私はこのようなデータが残っていますように、利用可能であるだけで、最新のデータを保持する:私は最高の年にサブセット場合
year city value
1 2010 Berlin 1234
2 2013 Munich 6372
3 2013 Frankfurt NA
、私はその年のためにそこにISNのNAを取得データ。 !is.na()
にサブセットを設定した場合、ののみが使用可能なすべての行が失われます。
具体的に何をしたいのですか?その都市のNAのみが存在し、NAが最も高い年でない限り、特定の都市のデータで最も高い年が得られます。それについてどうすればいいのですか?
何丁度あなたがサブセットたいですか?あなたの例から、あなたは最高年のサブセットを望んでいないようですが、ここに表示されない別の変数がありますか? –
ああ、いいえ:都市の列をサブセット化したいと思います。特定の都市のデータがある最も高い年です(その都市のNAのみが存在し、NAが最も高い年)。 それが明確になりますか? – LukasKawerau