2017-07-11 6 views
0

MacOS Sierra(10.12.5)でRStudio(3.3.1)を使用して、特定のTwitterユーザーのフォロワーのユーザープロファイル情報をスクラップしています。RでTwitterデータをスクラップしてアラビア文字が文字化けする

私の問題は、ユーザーのプロファイル記述がアラビア語の場合、返されるテキストが文字化けしていることです。例えば、このユーザ説明:

جزائرييسريدمالشهداءفيعروقهويطلبالعلمحتىيعلمالذين كفرواأندينالإسلامهودينالحق、والحقأقول..

このなる:

جزØØرÙÙÙÙØØØØØÙ Ø・Ù "ÙباÙ"عÙÙ "Ù...ØتÙ'Ù‰ØØÙ"Ù... "Ø°ÙÙ†ÙÙØØØØØ؆٠' دي†Ø§Ù"Ø ¥Ø³Ù "اÙ...Ù‡ÙØÙÙ†Ùا"ØÙ、ØŒÙا٠"ØÙ,Ù'ÙŽ Ø£Ù,ÙÙ" ..#أنØ'Øع٠" ؉ØμÙØØ

これは、私が取り組んでいるプロジェクトがTwitterのイスラム教徒ユーザーに焦点を当てており、多くのデータがアラビア語であるため、特に問題があります。

this answera similar questionはRStudio 3.3.3へのアップデートを提案しましたが、私はそれを試しても違いはなく、いくつかの私のパッケージの互換性に問題がありました。

ご協力いただければ幸いです。

答えて

0

私はアラビア語を読むことができませんが、私はこのTwitterの単語の雲をアラビア語のテキストにすることができました。部分的に基づいているWord cloud

# Get some tweets 
trump_tweets <- userTimeline("RTarabic", n = 1000) 

# Extract the text 
trump_text <- iconv(trump_text, 'UTF-8', 'ASCII') 
trump_text <- sapply(trump_tweets, function(x) x$getText()) 

私はUTF-8にそれを作ることはキーであると思いますが、私はほとんど私がここで話しているか知っている認めます。

関連する問題