2016-12-09 9 views
-1

私はMechanizeのとページをこすりしようとしているを使用している場合、完全なHTMLドキュメントを取得する方法:使用Mechanizeの

agent = Mechanize.new 
doc = agent.get("SomeURL").parser 

は、それは私があるから情報を取得する必要があり、文書全体や一部を返しません。示されていない。 Mechanizeに完全な文書を私に与えるように強制するにはどうすればいいですか?

+1

を試してみてください。ドキュメント全体が返されない場合は、何が返されますか?どの部分が欠けていますか?具体的にしてください。 –

+0

コマンドラインで 'wget'、' curl'または 'nokogiri'を使ってドキュメントを取り出し、データがあるかどうか調べます。原稿が解析された後、ブラウザによってDHTMLが読み込まれ、コンテンツがロードされているということは間違いありません。その場合、Mechanizeはあなたを助けません。JavaScriptを解釈するものが必要です。 –

答えて

0

は、私たちはあなたを助けるために十分な情報を持っていない

agent = Mechanize.new 
doc = agent.get("SomeURL") 
doc.body 
+3

今後の読者にとっては、コード単体の回答だけではなく、いくつかの説明を含めるほうがずっと便利です。 – EJoshuaS

+0

このコードスニペットは問題を解決するかもしれませんが、それがなぜ、どのように質問に答えるかは説明しません。 [あなたのコードの説明を含めてください](// meta.stackexchange.com/q/114762/269535)、本当にあなたの投稿の質を向上させるのに役立ちます。 ** Flaggers/reviewers:** [このようなコードのみの回答については、downvoteは削除しないでください!](// meta.stackoverflow.com/a/260413/2747593)(注:私はよく分かりませんこのドメインでは、この解答は実際には説明をするのに十分シンプルであり、したがって不要であることに注意してください。NAA/VLQフラグが増えないように説明を追加することができます。 –

関連する問題