私は本当に多くのオフラインhtmlファイルを持っています。私はそれらの名前、アドレスなどから取得する必要があります。そしてCSVを作成します。私はどのように良い方法がなければならないと思います...HTMLオフラインファイルは内容を取得します
はfor /r %%i in (*) DO (
findstr /o "name" %%i >> results.txt
ECHO ; >> results.txt
findstr /o "STREET" %%i >> results.txt
ECHO ; >> results.txt
etc
ECHO xxxendlinexxx >> results.txt
)
それは動作しますが、これは通常のexpresionとハードワークが必要なものを私に長いファイルを与える:例 -
私が最初にそれを魔女のバッチを実行しようHTMLのTAGコンテンツを読んでください。
私は、Python HTMLパーサが見つかりました:
from html.parser import HTMLParser
をしかし、私は、オフラインファイルと特定のタグ(idは= "何か")のために使用するホット知りません。私はグーグルでグーグルを見ているけど、わかりやすい解決策は見つけられません。
お手伝いできますか?例とベスト:
- どのように開いているファイル
- 保存コンテンツ
が助けてくれてありがとう別のファイルに特定のタグのコンテンツを見つける方法。
を必要なデータと、あなたのCSVをどのように見せたいかの例を示します。合理的なソリューションを作成するにはどうしたらいいですか? – Compo