2016-11-20 6 views
0

私はirbでUTF8コードポイントで文字列を表示していますが、実際の文字で表示することをお勧めします。たとえば、date de d\\u00e9partdate de départに変更するか、\\u4f4f\\u6240住所に変更します。"date de d u u00e9part"を "date dedépart"に変換するには?

これらの文字列は、File.readlines("myfile.txt")でファイルを読み取ることで構築されます。 file -I myfile.txtmyfile.txt: text/plain; charset=us-asciiを返し、"date de d\\u00e9part".encoding"#<Encoding:UTF-8>を返します。

+0

実際には 'myfile.txt'に正しい文字列が含まれていますか?二重バックスラッシュと 'charset = us-ascii'は' \ u00e9' _literally_、つまり '' \ '、' 'u'、' 0'、 '0'、' e'、 '9'を含むことを示唆しています。 。 – Stefan

+0

'myfile.txt'は正しい文字列を含んでいません。これはmongodbのダンプから来て、' \ '、' u'、 '0'、' 0'、 'e'、' 9' 。 – Florent2

+0

ダンプがJSON形式であると思われます。もしそうなら、多分あなたはそれを読み、 "myfile.txt"の代わりに "myfile.json"のような名前のファイルを使うべきです。 –

答えて

関連する問題