私はHTMLの塊を持っています。言葉を引き出す必要があります。文字列realClean
にはHTMLが含まれています。大きな文字列からワイルドカードを含む文字列を抽出する
<div class="smallfont">
<small>
Originally Posted By: chingy51o
</small>
</div>
私はchingy51o
を取り除く必要があります。私はしばらくこの問題を抱えていたので、私は一度私がそれを分離することができることを望んで、Originally Posted By:
を含む行を引き出すために私の検索を広げて、私はそこからより具体的なデータを抽出することができますしかし、私はその行を抽出することさえできます。
String authorString = "Originally Posted By: .*?";
if (realClean.contains(authorString)) {
Log.d("AUTHORS!", authorString + "\n");
}
でも、値は返されません。
ありがとうございました。あなたがスキャナーに言及したとき、私はドキュメントを見て回って、それを見つけ出すことができるかどうかを見てから、戻ってサンプルコードを見ました。これだけでは私が必要とする出力は得られませんでしたが、それは正しい道のりでした。私は今それを作者を抽出させる。再度、感謝します。 – r2DoesInc
文字列realCleanには、約20の「authorString」が含まれています。 realCleanを反復してそれらをすべて取り出す方法はありますか?私はhttp://pastebin.com/mC0vR9tVを試しましたが、最初の値を繰り返し返すだけです。 – r2DoesInc