x- ray/nodejsを使用してハッカーのニュース(https://news.ycombinator.com/)を削り取るにはどうすればよいですか?X線/ノード経由のハッカーニュースをスクラップ
私はそれから、このような何かを取得したいと思います:
[
{title1, comment1},
{title2, comment2},
...
{"‘Minimal’ cell raises stakes in race to harness synthetic life", 48}
...
{title 30, comment 30}
]
ありニューステーブルがあるが、私はそれをこすりする方法を知らない... の記事のそれぞれをウェブサイトは3つの列で構成されています。これらは、それらに固有の親を持たない。
x("https://news.ycombinator.com/", "tr", [{
title: [".deadmark+ a"],
comments: ".age+ a"
}])
と
x("https://news.ycombinator.com/", {
title: [".deadmark+ a"],
comments: [".age+ a"]
})
を第二のアプローチは、30名と29コメント-coutsを返します...私は:だから構造は、これまでのところ、私が試してみました。この
<tbody>
<tr class="spacer"> //Markup 1
<tr class="athing"> //Headline 1 ('.deadmark+ a' contains title)
<tr class> //Meta Information 1 (.age+ a contains comments)
<tr class="spacer"> //Markup 2
<tr class="athing"> //Headline 2 ('.deadmark+ a' contains title)
<tr class> //Meta Information 2 (.age+ a contains comments)
...
<tr class="spacer"> //Markup 30
<tr class="athing"> //Headline 30 ('.deadmark+ a' contains title)
<tr class> //Meta Information 30 (.age+ a contains comments)
のように見えます30タイトルのうちコメントがない情報がないので、それらを一緒にマップする可能性はありません。
何か助けがありました
も数にカウンターのコメントを変換して、エラーを処理するためには良いかもしれません –