1)read.tableを/サブsep = ","
とcomment.char = "]"
を使用してそれを読みます。これは、フィールドを分割し、末尾の]
を取り除くと、すべてそれの後に、その後、私たちはただsub
でV1
から[
を削除することができます。
Lines <- "[Alin Deutsch, Mary F. Fernandez, 1998],
[Alin Deutsch, Daniela Florescu, 1998],"
DF <- read.table(text = Lines, sep = ",", comment.char = "]", as.is = TRUE,
strip.white = TRUE, # might not need this one
col.names = c("Name1", "Name2", "Year"))
DF <- transform(DF, Name1 = sub("[", "", Name1, fixed = TRUE))
与える:
> DF
Name1 Name2 Year
1 Alin Deutsch Mary F. Fernandez 1998
2 Alin Deutsch Daniela Florescu 1998
2)をお読みください。パターンもう1つの可能性は、gsubfnにread.pattern
を使用することです。このパターンは、各行が[、で始まる最後の3つのカンマを持つ]を前提としています。これは問題に対応していますが、そうでない場合は、正規表現を変更する必要があります。
library(gsubfn)
read.pattern(text = Lines, pattern = ".(.*?),(.*?),(.*?).,", as.is = TRUE,
strip.white = TRUE, # might not need this one
col.names = c("Name1", "Name2", "Year"))
を与える。
sedの使用またはAWK以上を使用して3 coumnsに列ベクトルを分割しました... Rにインポートする前に '['を削除するには? – Roland
これらの関数はRに埋め込まれていますか? – sarashaker
いいえ、それらは(強力で高速な)コマンドラインテキストエディタです。あなたはRの中からそれらを呼び出すことができます。 – Roland