私は、Rに1つの列に住所を含む韓国語のデータフレームを持っています。私は単語(動詞で終わる単語)を抽出する必要があります(存在していない可能性があります)。この単語を含む "dong"という名前の新しい列を作成します。したがって、私のデータは列 "住所"に表示され、希望の出力は下の列 "洞"に表示されます。文字列から動詞で終わる単語(可変長の単語)をRで抽出する
address <- c("대전광역시 서구 탄방동 홈플러스","대전광역시 동구 효동 주민센터","대전광역시 대덕구 오정동 한남마트","대전광역시 동구 자양동 87-3번지 성동경로당","대전광역시 유성구 용계로 128")
dong <- c("탄방동","효동","오정동","자양동",NA)
data <- data.frame(address,dong, stringsAsFactors = FALSE)
私はgrepを使用しようとしましたが、私に必要なものが正確に与えられていません。 grepのではなく、文字列全体を返し、なぜ1)私は、私は必要な単語を識別するために、適切な正規表現を記述するかどうかはわかりませんし、2)私はわからない:
grep(".+동\\s",data$address,value=T)
は、私は2つの問題があると思います言葉。私は何か提案を感謝します。
追加ライブラリは必要ありません。[このデモ](http://ideone.com/Wff1NS)を参照してください。また、単語全体を空白ではなく単語の境界に合わせます。 –