-1
私はこの次のHTMLテーブルを持っているテキストファイル(.txt)で:HTMLテキストをCSVに変換するには?
<td class="det" colspan="1" width="40%">Basic EPS (Rs.)</td>
<td align="right" class="det">57.18</td>
<td align="right" class="det">48.84</td>
</tr>
<tr height="22px">
<td class="det" colspan="1" width="40%">Diluted Eps (Rs.)</td>
<td align="right" class="det">56.43</td>
<td align="right" class="det">48.26</td>
</tr>
CSV出力は次のようになります。それは、正規表現を使用することがあるかもしれないよう
Basic EPS (Rs.)|57.18|48.84
Diluted Eps (Rs.)|56.43|48.26
あなたは解析することが困難になるだろう ''
答えて
として魅力的このために、私は間違いなくあなたは、以下のように支援するためのPython
あなたを与えるBeautifulSoup
ライブラリを使用することをお勧めします::
あなたが持っているHTMLを囲む
<table>
<tr>
と最終</table>
タグが欠落しているので、それは私が処理する前にこれらを再び追加している正しく処理することができるようになります。次に、Pythonの
csv
ライブラリを使用して、出力のCSVファイルでセルの各行を正しく区切られた行として書き込むことができます。これはPython 2.xでテストされていますが、Python 3.xを使用している場合は代わりに
open('output.csv', 'w', newline='')
を使用する必要があります。代わりにお勧めしますが、ない:
出典
2017-11-20 17:45:46
関連する問題