テーブルの列からテキストを選択するPython Scrapy

def parse(self, response): 
    for row in response.css('body table:nth-child(5)'): 
     yield { 
      'name': row.css('tr td:nth-child(2)').extract() 
     }

このセレクタでテキストを取得するよう指定しようとしていますが、動作させられないようです。それは問題のない完全な要素を取得しますが、テキストのみが必要です。もし私がcss selector :: textをつけると、空文字列だけが返されます。あなたは、セレクタel::textを使用する場合は、テキストのみを抽出します：{[ "\ u00a0 \ u00a0"、 "ジョン・ドウ"、というように、 "名前"}]テーブルの列からテキストを選択するPython Scrapy

出典

2017-02-05 devemcn

何を試しましたか？また、どのような応答変数についての情報も含めてください。 – MaLiN2223

私はそこに投稿を編集して、結果の例とcss selector :: textを使用しました。 – devemcn

あなたがあなたのresuiltを取得した 'response'変数の例を提供すると役に立ちます。また、この[リンク]（http://stackoverflow.com/help/mcve）を参照してください – MaLiN2223

結果は
[ ですノードは<el>の中にありますが、テーブルのセル内のテキストは、span,pなどの入れ子のタグで囲まれています（ほとんどの場合可能です）。<el>のネストされたテキストノードをすべて抽出するには、el *::textセレクタを使用できます。

出典

2017-02-06 09:08:40 mizhgun

テーブルの列からテキストを選択するPython Scrapy

答えて

関連する問題