2011-01-17 3 views
0

私は取得要求を使用してページデータを取得していますが、完成したファイルからブレークタグを取り除く必要があります。基本的に私がやっているのは、リクエストを取得してファイルに保存することですが、削除する必要がある中断タグがあります。タグを削除するためにファイルが保存された後、バッチまたはVBスクリプトを実行すると問題はありませんが、どのように行うかについてはわかりません。今まで私が見た唯一の解決策は、行全体を削除することです。GETリクエストから<br/>を取り除く

EDIT:これは複数のWindowsサーバーに展開されるため、最小限の要件を維持したいと考えています。 I. Windowsがデフォルトで持っているコマンド/ソフトウェア。

答えて

0

あなたがPythonでau faitを使用している場合は、Beautiful Soupを使用して<br />要素をかなり堅牢な方法で削除できます。ツリーから要素を削除する方法については、hereを参照してください。

0

私が誤解していない限り、あなたはvbscriptのreplace関数(タグから引き継がれている)を使って改行タグを置き換えることができます。例:使用状況に関する

cleanedText = Replace(rawText,"<br/>","")) 

詳しい情報はこちらを

http://www.w3schools.com/Vbscript/func_replace.asp

その機能が逐語的に作用するので、あなたはすべてを取得するために数回を介して実行する必要があるかもしれませんけれどもそれは言及する価値がある見つけることができます一般的なタグのマークアップ:

cleanedText = Replace(rawText,"<br/>","")) //no spaces 
cleanedText = Replace(cleanedText,"<br />","")) // a space 
cleanedText = Replace(cleanedText,"<br>","")) // unterminated 
+0

申し訳ありません。私はvbscriptの作成に精通していません。これを私が使用したいテキストファイルにどのように指摘しますか? – tking

+0

申し訳ありませんが、私はvbscriptをあなたがそれにタグを付けていたと仮定しました。ブレークを含むデータを取得するget要求を実行するために使用する言語/スクリプトは何ですか? – MrEyes

+0

私はちょうどcronジョブを使用して、http get要求を行い、出力をテキストファイルに書き出します。私は、ページ内のvbscriptとは対照的に、Windowsスクリプトホストを使用するvbsスクリプトを考えていました。 – tking

関連する問題