ウェブサイトからテキストを取得しようとしています。言語を変更すると、html urlには "/ en"が内部にありますが、必要な情報を持っているページにはありません。私はそれをどのように行うことができます任意のアイデアをJava - HTMLの解析 - テキストの取得
http://www.wippro.at/module/gallery/index.php?limitstart=0&picno=0&gallery_key=92
html tags: (the text contains the description of the photo)
<div id="redx_gallery_pic_title"> text text </div>
問題は、ウェブサイトはドイツ語であると私は、英語のテキストをしたいということで、私のスクリプトは、ドイツ語版
を取得しますか?
java code:
...
URL oracle = new URL(x);
BufferedReader in = new BufferedReader(new InputStreamReader(oracle.openStream()));
String inputLine=null;
StringBuffer theText = new StringBuffer();
while ((inputLine = in.readLine()) != null)
theText.append(inputLine+"\n");
String html = theText.toString();
in.close();
String[] name = StringUtils.substringsBetween(html, "redx_gallery_pic_title\">", "</div>");
どのようなプログラミング言語をお使いですか? HTMLを解析するために使用する言語APIは何ですか?これまでにHTMLコンテンツを取得するためのコードを表示します。 – BalusC
プログラミング言語:Java –
私は答えを投稿しましたが、将来は本当にそのように言及してタグ付けする必要があります。サイトからHTMLを解析する方法がありますが、あなたはそれについて何も言わなかったのです。 – BalusC