ウェブサイトを自分のコレクションにインデックスしたいのですが、基本的には、すべての投稿のURLをループしてWordpressウェブサイトのインデックスを作成します。URLのタイプのドキュメントをコレクションに追加できますか?
など。
url=http://www.szirine.com/blog/2016/02/07/anne-dunn/
勿論、理想的に私は、例えば 、繰り返しインデックスドメイン全体またはURIにできるようにしたいでしょう
url=http://www.szirine.com/
url=http://www.szirine.com/blog/
データクローラはどこですか?私はダッシュボードで見つけられないようです。 – robyates
少し残念ですが、残念です。 https://console.ng.bluemix.net/dashboard/appsにアクセスし、下部にあるサービスのリストからDiscoveryをクリックします。 Discovery Serviceのインスタンスを自分で作成していない場合は、[Create Service]ボタンを使用してDiscovery Serviceのインスタンスを作成する必要があります。 Discovery Serviceのインスタンスのダッシュボードで、「使用目的」セクションを探します。 Data Crawlerのダウンロードリンクは、その段落にあります。 –
ありがとうございました。個々のスクラップされたhtmlファイルをループしなければならないので、私が望んでいたものではありません。 wgetコマンドとクローラは、Webページを取得します。この場合はWordPressサイトですので、WP REST APIを使用することもできます.GET/wp-json/wp/v2/postsを使用するとJSONを取得できます。 – remkohdev