私はhtmlファイルの数千を持っている...
は、あなたが実際に手にこれらのファイルを持っていますか、または彼らがオンラインでありますか?
...とTXTとしてそれらのそれぞれを保存する必要が...
任意のテキストエディタは、内のデータを保存することができるはずです(つまり、なぜFirefoxを使用して)、と私はストレートだと思います.htmまたは.htmlの名前を.txtに変更します。少なくとも(すべてのWindowsシステムで)動作します。つまり、と表示されているのは、のHTMLファイルのテキストですか?
EDIT:
まず、あなたがこれを行う必要がありますSHDOCVW、使用を開始する方法の良い説明を有し、this linkで始めます。あなたは参照が機能
Function GetNewIE() As SHDocVw.InternetExplorer
及びリンクから
Function LoadWebPage(i_IE As SHDocVw.InternetExplorer, i_URL As String) As Boolean
を使用して、セットアップしたら 使用して、あなたの個々のhtmlファイルをロードするために(単にリンクで説明したように、あなたのプロジェクトにコピー)各ファイルを処理するループ。(あなたがファイルのリストをセルに入れて、各セルを検索して取り出すことができるので、Excelはこれには良いだろう。)これほど多くのファイルでこのようなことは一度もしていないので、残念ながら...
Dim IE As SHDocVw.InternetExplorer
Dim lRow as Long 'Long in case you have a LOT of files
Dim iFNum As Integer
Dim sFilePath As String
Set IE = GetNewIE
For lRow = 1 To 5000 Step 1 ' Assuming you have 5,000 html files, so 5,000 rows with the paths to each
sFilePath = ActiveSheet.Range("A" & lRow).Value ' This should also include the filepath. i.e. "C:\dir\..."
If LoadWebPage(IE, sFilePath) Then
iFNum = FreeFile(lRow)
Open sFilePath & ".txt" For Output As iFNum
Write #iFNum, IE.Document.InnerText
Close #iFNum
End If
Next lRow
どのスクリプト言語も知っていますか?あなたはどんなシステムにいますか? – jdi
スクリプト言語はすべてOkです。あまりにも多くのスクリプトのプログラミングはここで必要と仮定します。 Windowsプラットフォーム。 – Hardbone
別のオプションは、テキストブラウザhttp://en.wikipedia.org/wiki/Lynx_%28web_browser%29 – Hardbone