私は分類情報を持つ大きなデータフレームを持っています。次に例を示します。data.frameの特定の列にstrsplitを適用します。
> d <- data.frame(x = c(1,2,3,4), classification = c("cl1.scl1", "cl2", "cl3-bla", "cl4.subclass2"))
> d
x classification
1 1 cl1.scl1
2 2 cl2
3 3 cl3-bla
4 4 cl4.subclass2
私は私がで分類文字列を分割する必要があることを意味分類情報を、集計する必要がある任意の更なる処理を行う前に「」最初のトークンを取る。現時点で
> d
x classification
1 1 cl1
2 2 cl2
3 3 cl3-bla
4 4 cl4
次のように私はこれを計算しています:これは私が必要とする結果である
d$classification = unlist(lapply(d$classification, function (x) strsplit(as.character(x), ".", fixed=TRUE)[[1]][1]))
これは動作しますが、それはこれを理解するために私にはかなり時間がかかりました。私はおそらく逃したよりエレガントなソリューションがあると仮定します。助言がありますか?ありがとう!
あなたの件名は少し誤解を招きます。これは実際に特定の列に関数を適用することではなく、strsplitから結果を操作する方法です。 –