2011-03-03 5 views
0

電子メールのコンテンツ(HTML形式)を取得して文字列に保存し、必要な詳細を取得してXML出力を準備する必要があります。Javaの文字列にHTMLをパースする

私はJAMESを使用しています。これをJavaで実行したいと考えています。 HTMLページを文字列にダンプするにはどうすればよいですか?あなたは、二重反転カンマ、スペース、構文解析中のバックスラッシュに何の問題もないと思いますか?

私のローカルシステム上でメールサーバーをテストしています。 私は

+1

[JAMES](http://james.apache.org/)は、*サーバではないですか?メール*クライアント*として、または受信メールを処理する際にサーバー側でこれを実行しますか?私はあなたの質問が有用すぎると答えが広すぎることを示唆しています。あなたが使用しているコードのスケルトンを投稿した場合、おそらく 'String htmlStr = // FooMessageImplをstringに変換するここでは、どこに変換が必要なのかを示します。 –

答えて

1

は、あなたがその一例で試すことができます..私が所望の値を持つXML文書を作成するために、解析用HTMLページを変換したいもう一方の端でフォーマットHTML にuser2がする@ localhostにlocalhostの@ USER1からのメールを送りました。 htmlページをダンプし、そのデータをdata.htmlファイルに書き込みます。 以下のコードから結果をStringBufferに追加し、htmlの特殊文字を置き換えることができます。

public class UrlReadPageDemo { 
    public static void main(String[] args) { 
    try { 
     URL url = new URL("http://example.com"); 

     BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream())); 
     BufferedWriter writer = new BufferedWriter(new FileWriter("data.html")); 

     String line; 
     while ((line = reader.readLine()) != null) { 
      System.out.println(line); 
      writer.write(line); 
      writer.newLine(); 
     } 

     reader.close(); 
     writer.close(); 
    } catch (MalformedURLException e) { 
     e.printStackTrace(); 
    } catch (IOException e) { 
     e.printStackTrace(); 
    } 
} 

}

関連する問題