2012-03-06 4 views
2

私はHTMLファイルから情報を抽出するC#モジュールを持っています。しかし、私の入力はMHTファイルです。 MHTファイルのhtml部分だけを抽出するにはどうすればいいですか?C#MHTファイルからHTMLを抽出します。

+2

MHTMLファイルは_Mime HTML_ファイルです。あなたはMimeパーサ/デコーダが必要です。 [関連する質問](http://stackoverflow.com/questions/3876406/basic-c-sharp-mime-decoding) –

+0

私は正しい方向に私を指してくれてありがとう! –

答えて

1

私はいくつかのツールを試しましたが、MHTの内容を抽出することができたと伝えられていましたが、ほとんどすべてが失敗しました(MHTファイルのプロバイダが正しくエンコードしていないことがわかりました)。私は最終的にMHTを解凍し、html部分だけを抽出できるようにするTotal Commanderを発見しました。それはハックだったが、仕事は終わった。

MHTを作成するためのツールが多く、アンパックするツールはほとんどないようです。

関連する問題