2017-10-29 20 views
-1

私は次のタグ '行' の属性を見つけるしようとしています:検索属性

行ID = "11" PostTypeId = "1" AcceptedAnswerId = "1248" を"0"、 "0"、 "0"などの相対的な時刻を表示するにはどうすればよいですか?CreationDate = "2008-07-31T23:55:37.967" Score = "749" ViewCount = "75079" Body = "<p> <コード> DateTime </code > :</p > <ul> <li> 2時間前< /李> <ヶ月前> 3日前のLi < /李> <李> < /李> </ulの> <P>エトセトラ? "LastEditorUserId =" 402022 "LastEditorDisplayName ="リッチB "LastEditDate =" 2013-12-16T00:28:55.377 "LastActivityDate =" 2014-04-09T11:50:10.300 "Title = "どのように私は相対的な時間を計算するのですか?" タグ=」<DATEDIFF> "AnswerCount =" 31" CommentCount = "10" FavoriteCount = "428" CommunityOwnedDate = "2009-09-04T13:15:59.820"

どのように私はPythonで正規表現を使用して、例えば、「再生回数」の属性と値のペアを得ることができる

+0

BS4はXML解析ライブラリではありません。 – DeepSpace

答えて

0

あなたが任意のXMLパーサーを使用したくない場合は、単にそれが正規表現を使用して行うことができます?

tagYouWannaLookFor = "ViewCount" 
regex = r"\b"+ tagYouWannaLookFor + "=\"(.*?)\"" 
match = re.search(regex, test_str) 

ライブデモhere

OUTPUT

>>> match.group(1) 
>>> 
75079 

サンプルのpython code

+0

ありがとう、本当に助けになる! –

+0

正規表現を使ってXMLを解析するのは間違っていて、 – DeepSpace

+0

に私はすでに言及しましたが、それはOPの要件であり、これは可能なアプローチであり、これも解析ではありません。 1つの値だけが必要な場合、構文解析は悪い考えです。なぜ、単一の値に対して長いxmlを解析するのですか?これは単なる可能性のあるユースケースですOPには他のシナリオがあるかもしれません。 –

関連する問題