-2
私はスペイン語twittsでテキストマイニングに取り組んでいます。私の問題は、同じ単語を持っていますが、異なる方法(アクセントとアクセントなし)、例:accion、acciónです。テキストの掃除アクセント
私はコーディングを使用しようとしました:ユニコード「UTF-8」、しかし仕事をしません。 マイライブラリ ライブラリ(stringi) ライブラリ(ツイッター) ライブラリ(TM) ライブラリ(wordcloud) ライブラリ(RColorBrewer)
を使用することになり、最も簡単な方法は、このアクセント文字を変更しようとしている場合は、についての情報をお読みください[良い質問をする方法](HTTP ://stackoverflow.com/help/how-to-ask)と[再現可能な例]を与える方法(http://stackoverflow.com/questions/5963269)を参照してください。これは他の人があなたを助けることをはるかに容易にします。 – zx8754
あなたができることは、アクセント付きの文字の「データベース」を作成し、それを翻訳することです。次に、これを個々のつぶやきに適用し、アクセント付きの文字を「フラッシュ」します。たとえば、 'sub'を使用することができます。 –