jsoupを使ってhrefの "カテゴリ"をexctractするコードの小さな部分を書きたいと思います。私はHerrscher des Mittelalters
を探しています。この場合jsoupで文字列から要素を抽出するには?
<a href="/wiki/Kategorie:Herrscher_des_Mittelalters" title="Kategorie:Herrscher des Mittelalters">Herrscher des Mittelalters</a>
。
私のコードは、BufferedReader
の.txtファイルの最初の行を読み取ります。
BufferedReader r = new BufferedReader(new InputStreamReader(new FileInputStream(new File(FilePath)), Charset.forName("UTF-8")));
Document doc = Jsoup.parse(r.readLine());
Element elem = doc;
href-linkを取得するコマンドがありますが、href-linkの要素を検索するコマンドがわかりません。
提案がありますか?
追加情報:私の.txtファイルには、完全なWikipedia HTMLページが含まれています。
にはIDが含まれていますか? – developer
申し訳ありませんが、私はHTMLについてよく知らないです。あなたはIDによって何を意味しますか? –
probsは、私のコードを参照してください – developer