私はこのサイトに掲載されているemojisを解凍しようとしていますhttp://www.i2symbol.com/emoticons/angry私のJSoupライブラリfor java。Jsoupを使用してhtmlページからシンボルを抽出するためにどのようなクエリを使用する必要がありますか?
私はすべての絵文字は、以下のdivのidに含まれているページのHTMLソースに気づいた:
次のシンボルのためのコードは
です&#x30FD;(&#x0CA0; _& #x0CA0;)&#x30CE; ( `0 ´ )/<div id="symbol_9" data-symbols="\(`0´)/" contenteditable="true">\(`0´)/</div>
( ╯ ° □ °)╯( ┻ ━ ┻
<div id="symbol_10" data-symbols="(╯°□°)╯︵ ┻━┻" contenteditable="true">(╯°□°)╯︵ ┻━┻</div>
\
<div id="symbol_0" data-symbols="ヽ(ಠ_ಠ)ノ" contenteditable="true">ヽ(ಠ_ಠ)ノ</div>
だから基本的には、シンボルは、HTMLのHEXコードです。 ここで与えられたセレクタ構文を見ました
https://jsoup.org/cookbook/extracting-data/selector-syntax しかし、これらのシンボルをHTMLページから抽出するための適切なセレクタクエリを作成することができません。
また、このページから約27個のシンボルが抽出される必要があるため、これらのシンボルを外部テキストファイルに保存するにはどうすればよいですか?
@Daveの助けを借りて、私はこのコードを書くことができました。しかし、これは私はちょうどそれが
<div id="symbol_10" data-symbols="(╯°□°)╯︵ ┻━┻" contenteditable="true">(╯°□°)╯︵ ┻━┻</div>
MY Javaコードから
( ╯ ° □ °)╯( ┻ ━ ┻を抽出どのように使用できるか、コードの行全体を印刷し
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class HTMLParserExample3 {
public static void main(String[] args) {
Document doc;
try {
doc = Jsoup.connect("http://www.i2symbol.com/emoticons/angry").get();
Elements symbols= doc.select("div[^data-symbols]");
for(Element symbol : symbols) {
System.out.println("\nSymbol: " + symbol);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
こんにちは、そんなに 輸入にjava.io.IOExceptionを感謝します。 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; パブリッククラスHTMLParserExample3 { public static void main(String [] args){ \tドキュメントdoc; \t try { \t \t doc = Jsoup.connect( "http://www.i2symbol.com/emoticons/angry").get(); \t \tエレメントシンボル= doc.select( "div [^ data-symbols]"); \t \t(要素記号:記号){ \t \t \t System.out.println( "\ n記号:" +記号); \t \t} \t \t \t \t \t}キャッチ(IOExceptionを電子){ \t \t e.printStackTrace(); \t} } } –
私は、コードを使用すると、私は全体のライン<
、すなわち得ることができるように、あなたは道を提案してくださいすることができ元の質問の例として、正確に何を抽出したいのですか? (あなたの期待している結果) – Dave