2017-08-03 6 views
0
<a href="some_url" game_id="Some integers"</a> 

「いくつかの整数」は、すべてのhrefリンクで変化する数字です。乱数を持つアクセサーに `tag.find_all`を使う(BeautifulSoup)

これからは、「some url」というhrefを抽出したいと思います。

私のコード:コードはhrefのリンクを検出できるように疑問符:私は「game_id」を入れるべきこと

for link in table.find_all("a",{"game_id":?}): 
    href=link.get(href) 

+0

あなたは ''いくつかの整数 ''を入力するだけで簡単に入力するべきです。また、 'href = link.get(href)'を 'href = link.get( 'href')'に変更する必要があります。 –

+0

hrefは 'class'やその他のデータ指向属性の一部ですか? –

+0

@LukaszSalitraはい "season_id"は常に93783なので、 "season_id" = 93783 –

答えて

1

最初のビットは、これを処理するにはregexが必要です。

import re 
for link in table.find_all('a', {'game_id' : re.compile('\d+')}): 
    href = link.get("href") # or href = link["href"] 

さらに、あなたはhrefフィールドにアクセスするために二重引用符を使用することができます。

+0

OPのコードを試してみたときと同じトラップになっています。これは ':'です。 –

+1

@ViníciusAguiar !ちょうど気づいた。 Ty。 –

+0

元の投稿を編集しました。 「いくつかの整数」は、hrefリンクごとに変化する「5267」のような数字です。問題は、整数がすべてのhrefリンクで変化しているため、game_idタグに特定の引数を入れることができないということです。 –

関連する問題