をテキストに、あなたは、オープンソースのJavaライブラリをお勧めすることができ(好ましくはASL/BSD/LGPLライセンス)プレーンテキストにHTMLを変換する - 、エンティティ(&、 を変換し、すべてのタグをきれいに等)と<br>とテーブルを正しく処理します。オープンソースのJavaライブラリ変換
詳細
私は、文字列としてHTMLを持って、ウェブからそれをフェッチする必要はありません。また、私が探していることは、このような方法は次のとおりです。
String convertHtmlToPlainText(String html)
また[jsoup(http://jsoup.org/)(http://stackoverflow.com/questions/9631477/retrieve-text-from-html-file-in-java)[ここ]記載されています、これはリベラルな[MITライセンス](http://jsoup.org/license)の下で配布されています。ちなみに、jsoupはあなたが 'Jsoup.parse(HTML)の.text()されているHTML5 – cubanacan
をここでサポートしています' – cubanacan
、少なくともそれは私が求めてきました何をしません文書に従って(HTML操作、プレーンテキストにページをしない変換) –