2016-04-06 11 views
0

私はストリーミング時に個人向けの通知アプリケーションで作業しています。先頭と末尾のdelimeterを使用して文字列を分割します

現在、URLを読み取り、.txtファイルとして保存できます。

今、私はそのファイルを「クリーン」しようとしています。

ドナー名:Mr.Bob

額:$ 15.00

このようにトークンを作成しながら、

<tr> 
    <tdclass="date">April11,2015,1:48p.m.</td> 
    <tdclass="donor-name">Mr.Bob</td> 
    <tdclass="charity-name">Whatever</td> 
    <tdclass="amount">$15.00</td> 
</tr> 
<tr> 
    <tdclass="date">April11,2015,2:31p.m.</td> 
    <tdclass="donor-name"> 
    // etc etc etc 

を、すべてを削除します。

例えば、私はこれを利用したいと思います

String toParse = readFile(fileName); 
    toParse = toParse.replace("\n","").replace("\r",""); 
    toParse = toParse.replaceAll(" ", ""); 
    String donorPattern = "donor-name\\\">([\\w\\s\\.]*)<"; 
    String amountPattern = "amount\\\">([\\d\\s\\.\\$]*)<"; 
+0

に役立つテキストファイルの内容を1つの長い文字列ですか?これまでに何を試しましたか? – DevilsHnd

+1

あなたの解析はHTMLページですか?答えが「はい」の場合は、JSoupのようなHTMLパーサが最適です。http://jsoup.org/ – marcellorvalle

答えて

0

Regexを使用することをお勧めします。キャプチャに

donor-name\">([\w\s\.]*)< 

正規表現:「ドナー名」の内容をキャプチャする

正規表現:特にこのケースでは、正規表現は、グループ「ドナー名」と「量」クラスであるをキャプチャします「量」の内容:

amount\">([\d\s\.\$]*)< 

彼らは正規表現を使用するには多くの可能な方法の一例であり、私は非常にあなただけの番号と一致する2番目のものを改善することをお勧めします。 Javaで正規表現の詳細については

:あなたはあなたの例で示してきたよう

https://docs.oracle.com/javase/8/docs/api/java/util/regex/Pattern.html

希望:)

関連する問題