2016-11-02 12 views
0

HTML文書を解析しようとしていますが、どこから始めたらいいか分かりません。JavaScript(Node)を使用してHTML文書を解析する

<div><p>Hello world</p></div>がこれを解析する方法はありますので、私は

のようなものを取得し、私が持っているとしましょう
{ name: div, 
    children: p 
} 
+1

を試してみてください?あなたは "ノードhtmlパーサー"をグーグルで開始することができます。ところで、これがノードの場合は、そのままタグを付けてください。 –

+0

@torazaburo - 私が見つけたhtmlパーサの多くは、壊れているか、必要なものがないので、私はこれを自分で行うことに決めました。私はまた、それが私のために良い練習になると思う。 –

+0

@ヒューマン・サイボーグリレーションズあなたは彼らがどのように壊れていたか、そしてあなたが必要としたものではないことを教えてください。それ以外の場合は、あなた自身がこの資料に精通していると仮定して約616ページの説明をします:https://www.w3.org/TR/html5/single-page.html – Brad

答えて

0

はグーグル を通じて見つけるのは難しいが、ここではリンクだとされていない必要があります。 https://www.npmjs.com/package/html-to-json

htmlToJson.parse(HTML、フィルタ、[コールバック]) - >約束 parse()メソッドは、文字列を取りHTML、およびフィルタを使用して、フィルタリングされたデータで応答します。これは、コールバックと約束の両方をサポートします。

var promise = htmlToJson.parse('<div>content</div>', { 
    'text': function ($doc) { 
    return $doc.find('div').text(); 
    } 
}, function (err, result) { 
    console.log(result); 
}); 

promise.done(function (result) { 
    //Works as well 
}); 
関連する問題