2017-03-09 17 views
0
<a id="ember1601" role="button" href="/carsearch/book?piid=AQAQAQRRg2INmYAyjZmAMwmKOGATj2qoYBQANIAVCeAZgB6fUEsAED&amp;totalPriceShown=71.66&amp;searchKey=-575257062&amp;offerQualifiers=GreatDeal" data-book-button="book-EY-EC-Car" target="_self" class="ember-view btn btn-secondary btn-action"><span class="btn-label"> 
    <span aria-hidden="true"> 
     <span class="visuallyhidden"> 
      Reserve Item 1, Economy from Economy Rent a Car Rental Company at $72 total 
    </span>Reserve 
    </span> 

</span> 
</a> 

こんにちは属性を、私はまた、どのように、私は上のタグ<a>のhrefのリンクを取得することができ、私は<span class="visuallyhidden">下価格& 72を得ることができないのpython に新しいです最初の行は、助けてください、ありがとう 私はbeautifulsoupのlibを使用しています他のlibが助けることができる場合は、私に教えてください。おかげPythonのBeautifulsoupは、隠れて、タグからコンテンツを取得することはできません

答えて

1
In [9]: soup = BeautifulSoup(html, 'lxml') # html is the code you posted 

In [10]: soup.find("span", class_="visuallyhidden").text 
Out[10]: '\n   Reserve Item 1, Economy from Economy Rent a Car Rental Company at $72 total\n ' 

In [11]: soup.a["href"] 
Out[11]: '/carsearch/book?piid=AQAQAQRRg2INmYAyjZmAMwmKOGATj2qoYBQANIAVCeAZgB6fUEsAED&totalPriceShown=71.66&searchKey=-575257062&offerQualifiers=GreatDeal' 

は、文字列から一部のテキストを抽出する必要がある場合、あなたは正規表現を使用する必要があります。

In [12]: text = soup.find("span", class_="visuallyhidden").text 

In [15]: re.search(r'\$\d+', text).group() 
Out[15]: '$72' 
+0

あなたの返信ありがとう、しかし、テキストを得ることができない、ウェブサイトのブロックのクローラかもしれない?ウェブサイトを確認するのを手伝ってください:https://www.orbitz.com/carsearch?date1=03%2F08%2F2017&date2=3%2F09%2F2017&loc2=lax&locn=lax&rdus=10&selCC=%5B%22economy%22%5D&vend= –

0

beautifulsoupはその

bs_obj = BeautifulSoup(html) 
tag = bs_obj.find("span", class_ = "visuallyhidden") # string "class" is reserved for python itself,so bs use string "class_" 
s = tag.string # that will get string inside the span 
... 
# you can get "$72" by regx 
のようにそのクラス名でタグを見つけることが可能となります

また、BSはあなたが

print(tag['href']) 
のように "[]" operator.JustによってタグのATTRにアクセスすることを可能にします

bs docオンラインで簡単な例を見ることができます。

+0

ありがとうあなたの返信のために、テキストを取得することはできません、ウェブサイトブロックのクローラかもしれません?ウェブサイトを確認するのを手伝ってください:https://www.orbitz.com/carsearch?date1=03%2F08%2F2017&date2=3%2F09%2F2017&loc2=lax&locn=lax&rdus=10&selCC=%5B%22economy%22%5D&vend= thanks –

関連する問題