私はこの1つのようにヘブライ語RSSを解析しようとしています: http://rss.walla.co.il/?w=/3/0/12/@rss.eコンバートのRSSエンコーディングUTF-8ノードのjs
私が使用していますfeedparserと要求し、問題がエンコーディングは、Windows-1255であることで、 UTF-8ではありません。
私はテキストを次のように表示します: 、普通のヘブライ語のテキストは好きではありません。
私は(iconv-liteのような)いくつかの変換を試みましたが、私は成功しませんでした。
これは私のコードです:
function getAll(URL) {
var request = require('request');
request(URL, function (error, response, body) {
if (!error && response.statusCode == 200) {
var allXML = body.substring(body.indexOf('<title>') + ('<title>').length, body.indexOf('</title>'));
var text = iconv.decode(new Buffer(allXML), 'win1255');
console.log("text = ", text);
}
})
}
、これは何が印刷である: テキスト=ן¿½ן¿½ן¿½ן¿½ן¿½! ן¿½ן¿½ן¿½ן¿½ן¿½ - ן¿½ן¿½ן¿½ן¿½ן¿½
あなたは現在唯一のネイティブノードUTF8をサポートしているので、エンコーディング間の変換をするためにこのようなiconv
や
iconv-lite
としてモジュールを使用することができます