2017-03-28 20 views
3

ハディスコーパスでテキスト解析とテキストマイニングを計画しているので、アラビア語でRとの作業を開始しました。私は自分の質問に関連するスレッドを読んでいますが、それでもなおここではREALの基礎を得ることはできません(ごめん、絶対初心者)。アラビア語のテキストがRに表示されない

だから、私は、入力された: textarabic.v < - スキャン( "データ/アラビア-TEXT.TXT"、エンコーディング= "UTF-8"、何= "文字"、9月は= "\ nの")

そして、textarabic.vが出てくるのはもちろん、シンボル(写真)です。これに先立って、私はスレッドで読むとutf-8にテキストを保存しましたが、アラビア語では何も表示されませんでした。

アラビア語のRを入力できますが、スキャンすると文字がシンボルに表示されます。

enter image description here

も読んで、他のユーザーのを実装しようとしたアラビア語のテキストを機能させるためにコードされているが、私もどこでどのようにそれらを実装するのか分かりません。 R、tm、NLPパッケージに追加しました。

あなたは私に次のことをお勧めしますか? お返事ありがとうございます。

+0

ようこそスタックオーバーフロー! [良い質問をする方法](http://stackoverflow.com/help/how-to-ask)と[再現可能な例を与える方法](http://stackoverflow.com/questions/)の情報をお読みください。 5963269)。これは他の人があなたを助けることをはるかに容易にします。 – zx8754

+1

あなたはWindows上にいますか?その場合、私はエンコーディングに関してひどい経験をしてきました。 -nix OSesは(UTF8)をかなりうまく処理しているようです。 –

+0

私は現時点でOS Xを使用しています。 – Esc6

答えて

0

私はあなたのコメントがOSX上にあることを知る前に、必ずWindowsでRを使用している必要があるという回答を投稿しました。 OSXでは、状況はそれほど悲惨ではありません。問題はあなたがRの古いバージョンを使用しているということです。私が正しく覚えていれば、3.2より前のものはUnicodeを正しく処理できません。 https://cran.r-project.org/bin/macosx/から3.3.3をインストールし、必要に応じて必要なパッケージを再インストールしてください。その後、あなたは大丈夫でしょう。 بالتوفيق!

関連する問題