2017-02-05 13 views
0
def parse(self, response): 
    for row in response.css('body table:nth-child(5)'): 
     yield { 
      'name': row.css('tr td:nth-child(2)').extract() 
     } 

このセレクタでテキストを取得するよう指定しようとしていますが、動作させられないようです。それは問題のない完全な要素を取得しますが、テキストのみが必要です。もし私がcss selector :: textをつけると、空文字列だけが返されます。あなたは、セレクタel::textを使用する場合は、テキストのみを抽出します :{[ "\ u00a0 \ u00a0"、 "ジョン・ドウ"、というように、 "名前"}]テーブルの列からテキストを選択するPython Scrapy

+0

何を試しましたか?また、どのような応答変数についての情報も含めてください。 – MaLiN2223

+0

私はそこに投稿を編集して、結果の例とcss selector :: textを使用しました。 – devemcn

+0

あなたがあなたのresuiltを取得した 'response'変数の例を提供すると役に立ちます。また、この[リンク](http://stackoverflow.com/help/mcve)を参照してください – MaLiN2223

答えて

0

結果は
[ ですノードは<el>の中にありますが、テーブルのセル内のテキストは、span,pなどの入れ子のタグで囲まれています(ほとんどの場合可能です)。<el>のネストされたテキストノードをすべて抽出するには、el *::textセレクタを使用できます。

関連する問題