を評価するために複数の列を設定し、私は今のところ私が持っている彼らのNAのに0はNAのがRにかなり新しい、-R
を設定するために、特定の列を副選択しようとしています:
col_names1 <- c('a','b','c')
col_names2 <- c('e','f','g')
col_names <- c(col_names1, col_names2)
data = fread('data.tsv', sep="\t", header= FALSE,na.strings="NA",
stringsAsFactors=TRUE,
colClasses=my_col_Classes
)
setnames(data, col_names)
data[col_names2][is.na(data[col_names2])] <- 0
しかし、私はdata.table(または文字ベクトル)である場合には、xがキーする必要があります(つまり、ソート:私は `[.data.table`(` * TMP * `、column_names2)でエラー
エラーが得続けます、ソートされているとマークされているので)、data.tableはどのカラムに参加するのかを知り、 f xはソートされます。 setkey(x、...)を最初に呼び出します。?setkeyを参照してください。
私はこのエラーは私が間違った順序を持っていると言っていると信じていますが、私はどうしているのですか?
ただの速報ですが、 'fread'はデータテーブルを返します。あなたはRの初心者ですから、実際にデータフレームが必要だったと思います。もしそうなら、 'fread'内で' data.table = FALSE'を指定してください。また、欠損値は0と同じではないことを覚えておいてください。あなたがやっていることによっては、バイアスにつながる可能性があります。 – Laterow