私はhtmlファイルからいくつかのテキストを削り取ろうとしていますが、例えばタグの中で用語(contextref
)を使って2種類のテキストが必要です。 :テキストを見つける瞬間BeautifulSoup htmlタグの2つの用語を使ってテキストを見つける - Python 3
1)<ix:nonfraction contextref="cfwd_30_04_2016" name="ns5:TangibleFixedAssets" unitref="GBP" decimals="0" format="ixt2:numdotdecimal" scale="0" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">180,649</ix:nonfraction>
2)<ix:nonfraction contextref="cfwd_30_04_2015" name="ns5:TangibleFixedAssets" unitref="GBP" decimals="0" format="ixt2:numdotdecimal" scale="0" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">200,395</ix:nonfraction>
私のコードは:180649:所与上記例についてvar1=(soup.find('ix:nonfraction',{'name':'uk-gaap:{}'.format(variable)}).text)
います。
両方の値を取得できるようにするには、name
(contextref
)と一緒に別の変数を追加する必要があります。違う組み合わせで再生しても動作しないようです。アウト
すべてのヘルプは素晴らしいことだ、感謝
はこのxmlコードですか?あなたが望む出力を投稿することができます。 –
ではありません。ファイルはすべて '.html'です ' var1'が最初のタグ= 180,649と 'var2'のテキストファイルを2番目の= 200,395から含むことが理想的な出力です。 2つのタグが同じヘッドタグ – reuben