私は、1列(Place
)が位置センテンスからなるデータセットを作成しています。セパレータで列を右から左に分割するR
librabry(tidyverse)
example <- tibble(Datum = c("October 1st 2017",
"October 2st 2017",
"October 3rd 2017"),
Place = c("Tabiyyah Jazeera village, 20km south east of Deir Ezzor, Deir Ezzor Governorate, Syria",
"Abu Kamal, Deir Ezzor Governorate, Syria",
"شارع القطار al Qitar [train] street, al-Tawassiya area, north of Raqqah city centre, Raqqah governorate, Syria"))
私はtidyverse package
の溶液を好むようにカンマ区切りによってPlace
列を分割したいです。 Place
の値は長さが異なるため、右から左に向かって始めたいと思います。したがって、国Syria
はこのデータフレームの最後の列の値です。
ああ、RegExコードを使ってアラビア文字を削除するボーナスはありますか?
ありがとうございます。
編集:
gsub("[\u0600-\u06FF]", "", airstrikes_okt_clean$Plek)
そしてtidyr方法で列を分割:アラビア語の文字(@のg5wのおかげで)除去するため :私の答えを見つけ
airstrikes_okt_clean <- separate(example,
Place,
into = c("detail",
"detail2",
"City_or_village",
"District",
"Country"),
sep = ",",
fill = "left")
'lapply()'のない解決策もありますが、tidyrはありますか?たぶん 'separator'関数を使用していますか? – Tdebeus
@Tdebeusあるかもしれないが、私は整った男ではない。 – G5W