1
私はこのウェブサイトからタイトルを取得したい:Jauntライブラリを使用してウェブサイトからデータをスクラップする方法はありますか?
<title><![CDATA[SUCCESSFUL INTERCEPT Pentagon confirms it shot down ICBM-type target]]></title>
、それはこのようなテキストが表示されます:この例のようにhttp://feeds.foxnews.com/foxnews/latest
米国防総省は、それがICBM-を撃墜確認
「SUCCESSFUL INTERCEPTをタイプ 米国は成功したミサイル傍受テストを実施しており、ペンタゴンは「
です。私はjauntライブラリを使用しました。それは要素タイプではなく、値のための唯一の「foxnew.com」
import com.jaunt.JauntException;
import com.jaunt.UserAgent;
public class p8_1
{
public static void main(String[] args)
{
try
{
UserAgent userAgent = new UserAgent();
userAgent.visit("http://feeds.foxnews.com/foxnews/latest");
String title = userAgent.doc.findFirst
("<title><![CDATA[SUCCESSFUL INTERCEPT Pentagon confirms it shot down ICBM-type target]]></title>").getText();
System.out.println("\n " + title);
} catch (JauntException e)
{
System.err.println(e);
}
}
}
あなたは文字列のタイトル= userAgent.doc.findFirst(「
は、フィード内の各項目のタイトルテキストを取得するには、以下を試してみてください? –
私はそれを試しました。出演は同じショーテキストです "foxnew.com" ありがとうございました:) – Puppet325