3
私はmhtファイルを持っていますが、mhtのすべてのテキストを取得したいと思います。私はregexの使用については苦労していますが、英語を除いてmhtには他の言語がありますので、テキスト自体にはA7 = A98 = D6のようなものが含まれています...mhtからテキストを抽出します
あなたのブラウザでは、それをコピーしてメモ帳に貼り付ける - これが私の必要なものです。
ありがとうございました。
私はmhtファイルを持っていますが、mhtのすべてのテキストを取得したいと思います。私はregexの使用については苦労していますが、英語を除いてmhtには他の言語がありますので、テキスト自体にはA7 = A98 = D6のようなものが含まれています...mhtからテキストを抽出します
あなたのブラウザでは、それをコピーしてメモ帳に貼り付ける - これが私の必要なものです。
ありがとうございました。
Internet Explorerでファイルを開き、プレーンテキスト(UTF-8)として保存します。 :)自動化されたソリューションが必要な場合は、プラットフォームまたはプログラミング言語用のmtto txtコンバータを探します。
実は、あなたにもPowerShellでこれを自動化することができます:私はC#を使用してい
$ie = New-Object -ComObject "InternetExplorer.Application"
$ie.Navigate2("file:///C:/MyFile.mht")
$text = $ie.Document.documentElement.innerText
、TXTコンバータへのMHTがありますか? C#アプリケーションでpowershellを使用するにはどうすればよいですか? –
その場合、適切な.NETライブラリが必要です。より多くの回答を得るには、質問に「c#」と「.net」とタグを付ける必要があります。 –
C#アプリケーションからPowershellを呼び出すこともできます。これは速く燃え尽きることはありませんが、うまくいくはずです。たとえば、次のURLを参照してください。http://www.codeproject.com/KB/cs/HowToRunPowerShell.aspx –