2009-07-22 6 views
1

クライアントサイドのみのHTMLエディタのテキストボックスに任意のページのソースをロードしようとしています。私は体だけでなくウェブページ全体のソースを得ることができる必要があります。このYQLクエリーは、単に体を返します。yqlでページのソース全体を取得する方法はありますか?

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22 

は、全体のソースを取得する方法はありますか、そのことができます他の無料JSON-P-XのWebサービスがあるのですか?

答えて

1

私はYQLでこれを行うための明白な方法はありませんが、ここでは動作するように見えるYahoo Pipeがあります。それは彼らのrobots.txtにより禁止されているサイトを取得することを拒否したが、それは他のサイトのために全体のソースを取得している:

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

デフォルトはのために拒否され、www.example.comに設定されていますそのページのrobots.txtただし、パラメータとしてURLを受け入れます。ここでpipes.yahoo.comのソースを取得し、JSONに包まれた結果を返します。このパイプの使用例へのリンクです:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

は、このヘルプをしていますか?

+0

これは近いです。パイプは、すべてのメタタグとスクリプトタグを除外しているようです。ページ全体を返すプロキシ/ウェブサービスはありますか? – Craig

関連する問題