2016-07-07 2 views
0

テキストファイルからテキストを読み取り、Latin-4(ISO/IEC 8859-4)またはLatin-6(ISO/IEC 8859-10)文字を対応するHTMLコード(またはその逆)に変換する方法はありますか? RおよびRStudioの、たとえばą&261;国際(リトアニア語)の文字をRの対応するHTMLコードに変換するには?

特に私は、これらのシンボルをコーディング/デコードすることに興味があります。¡ččÍęĖėššŠøøūŽº。 私はこの作業のために正規表現を使用しようとしましたが、最初の問題は私のRStudioも正しくシンボルを読んでいないということです。

c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž") 

結果は次のとおりです。

[1] "Aa Cc Ee Ee Ii Uu Uu ˇ˛" 

答えて

1

まあ、最高のR非ASCIIロケールで読み込むパッケージは、Hadley Wickhamのreadrです。

hereからインストールし、Latin-6に対応していることを確認してください。

関連する問題