私はちょうど掻き集めるウェブサイトを学び始めています。ウェブサイトの掻き取り| JSONファイルを作成するにはどうすればよいですか?
私が掻いているウェブサイトには、メインの「コンテンツ」があります。コンテンツdivの中には記事があり、記事の見出しは<h2>
タグの内側にあります。
私は次のコードを使ってヘッダーを参照する方法を考え出しました。今、すべてのヘッダーをJSONファイルに保存します。見出しごとにオブジェクトを作成する方法明らかに私のコードは、のタイトルobjのすべての繰り返しで、を置き換えます。あなたは、各<h2>
要素について{title: "Some title"}
に似たオブジェクトの配列をしたい場合は
var title, date, img_url, permalink;
var obj = { title : "", date : "", img_url : "", permalink : ""};
// ======== Extracting Title ================
$('#Content').filter(function(){
var data = $(this);
let headers = data.find('h2');
headers.each(function (i, el) {
obj.title = $(el).text();
})
})