0
私はtwitterのデータを使ってテキストマイニングプロジェクトを進めています。私のデータフレームでは、多くの単語がUnicode文字に変換されます。 特定の文字で始まり、終わる文字列を見つける
<U+0E2B><U+0E25><U+0E07><U+0E1E>
は、私はすべてが上記のような言葉を変換収集し、私は別々に扱うことができるように1つの大きな文字列に入れたいです。
<U+
で始まり、>
で終わるすべての文字列をRで検索する方法はありますか?
おそらく、あなたは 'grepを探しています( "^(?:)+ $"、x)'は –
私はこれを試してみました私のデータフレームには行がありますが、何らかの理由で結果が返されます: 'integer(0)' – Marco
期待される出力をサンプルデータとして提供してください。 –