2016-07-12 9 views
-1

私はこの1つのようにヘブライ語RSSを解析しようとしています: http://rss.walla.co.il/?w=/3/0/12/@rss.eコンバートのRSSエンコーディングUTF-8ノードのjs

私が使用していますfeedparserと要求し、問題がエンコーディングは、Windows-1255であることで、 UTF-8ではありません。

私はテキストを次のように表示します: 、普通のヘブライ語のテキストは好きではありません。

私は(iconv-liteのような)いくつかの変換を試みましたが、私は成功しませんでした。

これは私のコードです:

function getAll(URL) { 
var request = require('request'); 
request(URL, function (error, response, body) { 
    if (!error && response.statusCode == 200) { 
     var allXML = body.substring(body.indexOf('<title>') + ('<title>').length, body.indexOf('</title>')); 
     var text = iconv.decode(new Buffer(allXML), 'win1255'); 
     console.log("text = ", text); 
    } 
}) 

}

、これは何が印刷である: テキスト=ן¿½ן¿½ן¿½ן¿½ן¿½! ן¿½ן¿½ן¿½ן¿½ן¿½ - ן¿½ן¿½ן¿½ן¿½ן¿½

あなたは現在唯一のネイティブノードUTF8をサポートしているので、エンコーディング間の変換をするためにこのような iconviconv-liteとしてモジュールを使用することができます

答えて

0

、 utf16le、latin1/binary、ascii、hex、およびbase64です。

0

私はこのソース使用:github

function getText(URL) { 
http.get(URL, function(res) { 
    var chunks = []; 
    res.on('data', function(chunk) { 
     chunks.push(chunk); 
    }); 
    res.on('end', function() { 
     var decodedBody = iconv.decode(Buffer.concat(chunks), 'win1255'); 
     console.log(decodedBody); 
    }); 
}); 

}

関連する問題