2009-05-15 22 views
3

私はmhtファイルを持っていますが、mhtのすべてのテキストを取得したいと思います。私はregexの使用については苦労していますが、英語を除いてmhtには他の言語がありますので、テキスト自体にはA7 = A98 = D6のようなものが含まれています...mhtからテキストを抽出します

あなたのブラウザでは、それをコピーしてメモ帳に貼り付ける - これが私の必要なものです。

ありがとうございました。

答えて

1

Internet Explorerでファイルを開き、プレーンテキスト(UTF-8)として保存します。 :)自動化されたソリューションが必要な場合は、プラットフォームまたはプログラミング言語用のmtto txtコンバータを探します。

実は、あなたにもPowerShellでこれを自動化することができます:私はC#を使用してい

$ie = New-Object -ComObject "InternetExplorer.Application" 
$ie.Navigate2("file:///C:/MyFile.mht") 
$text = $ie.Document.documentElement.innerText 
+0

、TXTコンバータへのMHTがありますか? C#アプリケーションでpowershellを使用するにはどうすればよいですか? –

+0

その場合、適切な.NETライブラリが必要です。より多くの回答を得るには、質問に「c#」と「.net」とタグを付ける必要があります。 –

+0

C#アプリケーションからPowershellを呼び出すこともできます。これは速く燃え尽きることはありませんが、うまくいくはずです。たとえば、次のURLを参照してください。http://www.codeproject.com/KB/cs/HowToRunPowerShell.aspx –

関連する問題