私はPythonでWebページからテーブルのデータを解析するためにセレンを使ってスクリプトを書いています。しかし、私はそれを実行すると、テーブル形式の代わりに単一の列にデータをスクレイプします。データをテーブル形式で取得するには、スクリプトでどのような変更を行う必要がありますか?これまでに試したことは次のとおりです。テーブル形式ではなく単一の列でデータを掻き集める
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://fantasy.premierleague.com/player-list/")
table_data = driver.find_elements_by_xpath("//table[@class='ism-table']")[0]
for item in table_data.find_elements_by_xpath(".//td"):
print(item.text)
driver.quit()
表形式の意味は次のとおりです。しかし、私は以下のようにいくつかの列の代わりに単一の列にデータを取得しています。
フォワード、ミッドフィルダー、ゴールキーパー、ディフェンダーの選手を指定する必要はありませんか?あなたがデータをループする方法では、このチャーを与えることはありません。 また、セレンは一般にあまりにも重いので、最後のオプションとしてのみ使用します。あなたが解析しているこの特定のページはうまく構成されているので、私はBeautifulSoupの使用をお勧めします。 –
「表形式」とはどういう意味ですか?それを指定してください。 –
彼は表を提示したいと思っていますが、あなたが全テーブルの行を掻き取ったときに知っているように、範囲のある他のループを使用しています...私は... cloumsをgetすべてのITEMSまたはVALUEをそれぞれの尊敬リストにまとめておきます。パンダを使って一緒に叩く...または各clomnの値とキーの後に... format printまたはtoは同じrandと時間ですべてを出力します。 ..私もまた...いいえbs4を意味する?あなたは本当のパーサーが必要です – scriptso