私はちょうどタイトルの中にある問題を記述するのは難しいので、あまりにも曖昧であることをお詫び申し上げます。私はHackerNewsの記事のタイトルを拝見していますが、JSONファイルに結果を書き込むときに問題があります。それ以外のすべてのエントリは空の "タイトル"オブジェクトです。私の出力のサンプル:あなたが見ることができるようにScrapyを使用しているときに空のJSONエントリを取得する
{"title": []},
{"title": ["Buffett Assails Money-Manager Fees as Berkshire Reports Profit Rise"]},
{"title": []},
{"title": ["Linus on Git and SHA-1"]},
{"title": []},
{"title": ["Machine Learning from scratch: Bare bones implementations in Python"]},
{"title": []},
{"title": ["The Future of Not Working"]},
{"title": []},
...
、私は正常にリンクのタイトルを取得するんだけど、他のすべての一つは、空のようです。なぜこれが起こっているのか少し混乱しています。これを行うためのコードは非常にシンプルです(しかし、私はScrapyも新しくなっているので、おそらく何か不足しています)。ここに私のコードです:
def parse(self,response):
for title in response.css('td.title'):
yield {
'title' : title.css('a.storylink::text').extract(),
}
おかげさまで助けを!