私はコーディングにはとても新しいので、coinmarketcapからlitecoinの現在の価格をインポートするコードを書こうとしました。しかし、私はそれを動作させることはできません、それは印刷し、空のリスト。私はPythonへのウェブスクレイピングに問題があります
import urllib
import re
htmlfile = urllib.urlopen('https://coinmarketcap.com/currencies/litecoin/')
htmltext = htmlfile.read()
regex = 'span class="text-large2" data-currency-value="">$304.08</span>'
pattern = re.compile(regex)
price = re.findall(pattern, htmltext)
print(price)
アウトは "[]"となります。問題はおそらく軽微ですが、私は非常に助けに感謝しています。
私のコードでは一重引用符を使用しましたが、スタックオーバーフローは "span class =" text-large2 "data-currency-value =" "> $ 304.08"から$ 304.08に直接変換されました。 –
通常、正規表現はHTMLを処理するための最良のツールではありません。私は[BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/)のようなものを見ることをお勧めします。それはさておき、あなたの '正規表現'パターンはおそらくあなたが考えるべきことをしません。 [documentation](https://docs.python.org/3.4/library/re.html)を確認してください。 – Galen
リ – Simon