ハディスコーパスでテキスト解析とテキストマイニングを計画しているので、アラビア語でRとの作業を開始しました。私は自分の質問に関連するスレッドを読んでいますが、それでもなおここではREALの基礎を得ることはできません(ごめん、絶対初心者)。アラビア語のテキストがRに表示されない
だから、私は、入力された: textarabic.v < - スキャン( "データ/アラビア-TEXT.TXT"、エンコーディング= "UTF-8"、何= "文字"、9月は= "\ nの")
そして、textarabic.v
が出てくるのはもちろん、シンボル(写真)です。これに先立って、私はスレッドで読むとutf-8にテキストを保存しましたが、アラビア語では何も表示されませんでした。
アラビア語のRを入力できますが、スキャンすると文字がシンボルに表示されます。
も読んで、他のユーザーのを実装しようとしたアラビア語のテキストを機能させるためにコードされているが、私もどこでどのようにそれらを実装するのか分かりません。 R、tm、NLPパッケージに追加しました。
あなたは私に次のことをお勧めしますか? お返事ありがとうございます。
ようこそスタックオーバーフロー! [良い質問をする方法](http://stackoverflow.com/help/how-to-ask)と[再現可能な例を与える方法](http://stackoverflow.com/questions/)の情報をお読みください。 5963269)。これは他の人があなたを助けることをはるかに容易にします。 – zx8754
あなたはWindows上にいますか?その場合、私はエンコーディングに関してひどい経験をしてきました。 -nix OSesは(UTF8)をかなりうまく処理しているようです。 –
私は現時点でOS Xを使用しています。 – Esc6