私はMicrosoft Wordから生成された非常に大きな文書をhtml形式で持っています。それはsoooo messyであり、肥大したもの(unknowタグ、名前空間などの膨大なものなど)がいっぱいですマイクロソフト社のhtml docをクリーンアップする方法は?
プレーンhtml sytaxに変換する方法はありますか?
私はMicrosoft Wordから生成された非常に大きな文書をhtml形式で持っています。それはsoooo messyであり、肥大したもの(unknowタグ、名前空間などの膨大なものなど)がいっぱいですマイクロソフト社のhtml docをクリーンアップする方法は?
プレーンhtml sytaxに変換する方法はありますか?
お試しHTML Tidy私はそれがMS Word(確かに少なくともWord 2000まで、しかしおそらく最近のバージョンでも)によって生成されたHTMLでうまく動作すると聞いています。
これは実際のプログラミングに関する質問ではありませんが、(少なくとも最近のバージョンの)Wordは、Office固有のタグとプロパティを削除し、ドキュメントに必要なタグだけを残す「Webページ、フィルタ」に保存できます。ウェブブラウザでレンダリングされる。したがって、Wordをお持ちの場合は、HTML文書を開いてその形式で保存することができます。
あなたはおそらくHTML Tidyを探しています。ほとんどすべての言語でアダプタが用意されています。それは、Microsoft WordのHTML出力(および他の多くの機能)をクリーンアップするオプションがあります。
try Cleanup HTML単語をクリーンアップするオンラインツール