2017-08-04 8 views
0

hereからテーブルの内容を解析したいと考えています。ただし、テーブルは複数のページに分かれています。私の問題は、urlアドレスに変更がないため、page 2以降のページを解析できないことです。他のページが保存されている場所にあるurlのアドレスを検索するにはどうすればよいですか?私はlxmlrequestsを使用しています。URLアドレスを変更せずに複数のページを解析する

+0

ブラウザを起動するために 'selenium'を使う必要があります。' javascript'でページを動的に読み込むことができます。 – PYA

答えて

1

あなたはクロームデベロッパーツールを開き、ページネーションコントロールに「2」をクリックすると、スクリプトによって行われた要求がページ「2」の日付を取得するために表示されます。

POST https://www.mutualfundindia.com/MF/return/TopFundDetails?page=2 

フォームデータを持つ:

__RequestVerificationToken:AYv1N1VEGXTeLKMbnHolT_bste-CiFcH1GAjQgh1O7c_Ygm0-wIP3j47yN6e5tzYx3EumwCRBYcxI6825nH28W_qO60ZMlnAm4f1utRjqL4wgokl87pgsV4anV4vKtSjk6XV0g2 
Rank:-1 
Type:-1 
Nature:-1 
SubNature:-1 
cmdAum:1 
Period:1Year 
ShortingOrder:DESC 
hdHeaderId:1Year 
あなたは要素で、ページ上の__RequestVerificationTokenの値を見つけることができます

<input name="__RequestVerificationToken"... 

要求の応答は純粋なHTMLです。

このようなリクエストを行うと、すべての日付を解析すると思います。

希望、これは役立ちます。

+0

上記を説明する小さなコードを書くことは可能でしょうか?私は上記の解決策を理解しようとしていますが、ページングコントロールがどこにあるのかわかりません...ページ2へのリンクはタグですが、クリックすると何も起こりません! –

関連する問題