まずIデータのインポートに取り組んでいます
Rのdata.frames(テキストマイニング)内の単語を置き換えますそれ。ここで
は、私が得たものである:
rawData = sqlQuery(dwhConnect,sqlString)
a = data.frame(rawData$ENNOTE_NEU)
私は
a[[1]][1:3]
を行う場合は、構造を参照してください。
[1] lorem ipsum li ld ee wö wo di dd
[2] la kdin di da dogs chicken
[3] kd good i need some help
は今、私は私で洗浄するいくつかのデータをやりたいです自分の辞書。 例はリーに置き換えることであろうとKDなどkdin
私の問題は、全体のデータフレームのためにそれを行う方法であるクンデとLoremのイプサムを持ちます。
for(i in 1:(nrow(a)))
{
a[[1]][i]=gsub(" kd | kdin " , " kunde " ,a[[1]][i])
a[[1]][i]=gsub(" li " , " lorem ipsum " ,a[[1]][i])
...
}
多くのデータでは低速ですが、
もっと良い方法がありますか?
歓声キャプテン
これはSQLで直接実行するか、またはR? – daroczig
SQLとgsubのアイデアは今のところ良いです。速度が重要な場合は、Rcppにカスタム関数を書くこともできます。 –