0
私はストリーミング時に個人向けの通知アプリケーションで作業しています。先頭と末尾のdelimeterを使用して文字列を分割します
現在、URLを読み取り、.txtファイルとして保存できます。
今、私はそのファイルを「クリーン」しようとしています。
ドナー名:Mr.Bob
額:$ 15.00
このようにトークンを作成しながら、<tr>
<tdclass="date">April11,2015,1:48p.m.</td>
<tdclass="donor-name">Mr.Bob</td>
<tdclass="charity-name">Whatever</td>
<tdclass="amount">$15.00</td>
</tr>
<tr>
<tdclass="date">April11,2015,2:31p.m.</td>
<tdclass="donor-name">
// etc etc etc
を、すべてを削除します。
例えば、私はこれを利用したいと思います
String toParse = readFile(fileName);
toParse = toParse.replace("\n","").replace("\r","");
toParse = toParse.replaceAll(" ", "");
String donorPattern = "donor-name\\\">([\\w\\s\\.]*)<";
String amountPattern = "amount\\\">([\\d\\s\\.\\$]*)<";
に役立つテキストファイルの内容を1つの長い文字列ですか?これまでに何を試しましたか? – DevilsHnd
あなたの解析はHTMLページですか?答えが「はい」の場合は、JSoupのようなHTMLパーサが最適です。http://jsoup.org/ – marcellorvalle