1
私は多数のURLを持つcsv-fileを手に入れました。私はそれを便宜のためにパンダのデータフレームに読みました。私は後でいくつかの統計作業をする必要があります - そしてパンダはちょうど便利です。それは少しのようになります。Webは複数のページをpython 3で擦っていますか?
import pandas as pd
csv = [{"URLs" : "www.mercedes-benz.de", "electric" : 1}, {"URLs" : "www.audi.de", "electric" : 0}]
df = pd.DataFrame(csv)
私の仕事は、ウェブサイトが特定の文字列が含まれているかどうかを確認すると、その場合1
で、余分な列を追加すると、他の0
です。たとえば、car
という文字列を含むwww.mercedes-benz.de
をチェックしたいとします。私はpd.URLs
を通じて/ループを反復処理し、パンダのデータフレームに情報を格納するにはどうすればよい
import requests
page_content = requests.get("www.mercedes-benz.de")
if "car" in page_content.text:
print ('1')
else:
print ('0')
?
Aフォローアップ:GETリクエストが失敗した場合 - 例えばURLがないか間違っている場合、ループを実行し続けることは可能ですか? @jezrael – Rachel
私のためのハードクエストですが、Pythonで何らかのサイレントエラー処理をしました。私はそれを使用しないので、あなたに良いアドバイスを与えることはできません。ごめんなさい。まだ問題がある場合は別の質問をしてみてください。 – jezrael