jsoup

    1

    1答えて

    私はjavaで検索エンジンを実装しています。私はJsoup APIを使用してクローラコンポーネントを作成していますが、まだまだ理解していない2つのことがあります。まず:それはロボットに設立されたとして、すなわちWikipediaのサイトから私は、ユーザーエージェントのサイトでブロックされているいくつかのクローラがあります。この private static final String agent =

    1

    1答えて

    私はhref属性を取得するためにjsoupのメソッドattr()を使用しているElementリストを持っています。 ここに私のコードの一部です: String searchTerm = "tutorial+programming+"+i_SearchPhrase; int num = 10; String searchURL = GOOGLE_SEARCH_URL + "?q=

    -1

    1答えて

    を得るために、私のURLを変換jsoup: String url = "http://www.tahlildadeh.com/%D8%A2%D9%85%D9%88%D8%B2%D8%B4/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%DA%AF%D8%A7%D9%85-%D8%A8%D9%87-%DA%AF%D8%A7%D9%85-%D8%A7%D9%86%D8%AF%D8%B1

    1

    1答えて

    中に製品レコードにHTMLクラスを組み合わせるために、私はこのようなメニューをこすりしようとしています: - 私はおそらく文字列の配列に各クラスを反復することにより、メニューオブジェクトを作成することができます <h3 class="product">Four Cheese Spinach Dip</h3> <h3 class="specialcallout">Vegetarian</h3>

    0

    1答えて

    htmlページが2つあるとします。ページ1とページ2 のPage1は <div class="content"> <p></p> <p></p> </div> ようなHTMLが含まれているとPAGE2は今、私はそれがあれば言って、このコードで Document document = Jsoup.connect(url).get(); Elements links = doc

    0

    2答えて

    Jsoup.connect()メソッドを使用してWebサイトから取得したHTMLソースがあります。そのHTMLソースからのコードの一部を以下に示します(リンク:https://docs.microsoft.com/en-us/visualstudio/install/workload-component-id-vs-community)は ..... <p>When you set depend

    0

    1答えて

    私は定期的にタスクを実行するasynctaskを定義しています。できます。私は無数の時間をテストしました。しかし何らかの理由で時折クラッシュすることがあります。 stacktraceが非常に曖昧なので、私は問題の原因を見つけることができません。ここでスタックトレースです:まず Fatal Exception: java.lang.RuntimeException: An error occured

    2

    1答えて

    JSoupでGoogle検索結果のリストを取得しようとしています。私が現在使っている方法は最初のページ(n)では完璧に動作しますが、n + 1ページではうまく動作しません。ここでは、私が最初のページを取得しています方法です:最初のページのhttps://www.google.com/search?q=apple: doc = Jsoup.connect(search).userAgent("Chr