2017-07-27 10 views
0

私はしばらくこの状態にあり、助けを受けてタオルを投げています。 this pageをスクラップしようとしています。具体的には、次の図の緑色で強調表示された情報を持つすべてのテーブル行にアクセスしようとしています。私は表のヘッダーは必要ありません、行だけです。 Scrapyで正しいCSSセレクタを作成する問題

enter image description here

私は、各セクションのエリアに取得することができています(それが「メインキャンパス」と言います)、次のセレクタ

response.css('.datadisplaytable .datadisplaytable') 

を持つテーブルので、私は二回.datadisplaytableを使用選択しようとしているのは、そのクラスのテーブルの中です。その後何が、私は後にしていますテーブルの行を取得するために私には理にかなって、次のセレクタ

response.css('.datadisplaytable .datadisplaytable tbody:nth-child(2)') 

を使用することですしかし、私はこのセレクタで何も得ます。私は間違って何をしていますか?

答えて

1

セレクタが少しオフです。 2番目の<tbody/>タグを取得しようとしていません。

.datadisplaytable .datadisplaytable tbody tr:nth-child(n+2) 

これですべての行が表示され、各表のヘッダーはスキップされます。

+0

私はそれをスクラップシェルで試して、何も戻ってきませんでした。 – ehThind

+0

'tr:nth-​​child(n + 2)'は、兄弟の2番目以降のすべてのtr子を選択します。 –

+0

@eh私はScrapyに慣れていません。私はそのページのコンソールに行き、 '$( 'datadisplaytable .datadisplaytable tbody tr:nth-​​child(n + 2)') 。 –

関連する問題