私はウェブページを呼び出すスクリプトを作成しようとしています(http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode次に=ツリー&キープ= 1 & srchmode = 1 &アンロックF & ID = 7742 & LVL = 3 & LIN =)、それをスキャンし、ネストされた各分類群内での注文、ファミリー、属、および種を引き出し。しかし、私は脊椎動物(ウェブサイト全体の非常に小さな部分)しか望んでいないが、様々な脊椎動物の分類群に関連するURLは、識別可能なパターン(すなわち、順次)ではない。これを合理的に行う方法はありますか?私は、この目標を達成するためのさまざまな方法を策定しようとすると、多くの問題を抱えてきました。Pythonは多重URLを呼び出してデータを引き出す
0
A
答えて
0
あなたは何をしたいか分かりませんが、私が理解したように、ページ内のリンクを探す何らかの種類のクローラを作成する必要があります。サイトを分類して分類しますか?などのフォームを提出し、簡単にリンクを抽出して、次の、あなたはWebブラウザをエミュレートし、サイトに沿って移動することができます
もしそうなら、mechanizeのために行く、など
関連する問題
- 1. php: "*"を引数として呼び出すpythonスクリプトを呼び出す
- 2. 静的メソッドの多重呼び出し
- 3. は、URLを呼び出し、
- 4. Pythonの多重継承:呼び出すsuper()の選択
- 5. Pythonコードで引数を呼び出す
- 6. pythonサブプロセス呼び出しを使用してpythonスクリプトを呼び出す
- 7. 引数でデバウンス関数呼び出しを呼び出す
- 8. 呼び出すPythonスクリプトは、私はPythonスクリプト呼び出しています
- 9. URLでJavascriptの関数呼び出しを呼び出す
- 10. 複数のAPI URLを呼び出して同時に呼び出します
- 11. API呼び出しを介してinfluxdbからデータを引き出す方法は?
- 12. URL引数を使用した動的Webサービス呼び出し
- 13. 参照引数を使ってpythonメソッドを呼び出す
- 14. メソッドへの引数の呼び出しが多すぎます
- 15. クラスを呼び出すmysqlレコードを引き出す
- 16. Pythonはパラメータを使用してURLで呼び出しを要求します
- 17. メソッド呼び出しで引数が多すぎる
- 18. 関数を呼び出して、多重処理でいくつかの引数を渡す方法
- 19. 一重引用符でPHPコードを呼び出す
- 20. Swagger UIの呼び出し呼び出しURL
- 21. 引数としての部分関数呼び出しpython
- 22. Pythonマルチプロセッシングが関数呼び出しを呼び出さない
- 23. Powershellは引数付きMSIを呼び出します
- 24. 奇妙な "呼び出しフィールド"引き出し "(テーブル値)"エラー
- 25. ストアドプロシージャpythonを呼び出す
- 26. Pythonメソッドを呼び出す
- 27. Pythonを呼び出すメソッド
- 28. Haskell、再帰呼び出し、多くの引数
- 29. イメージをページに呼び出すにはURL引数を使用しますか?
- 30. Pythonを使用してJavaの出力を呼び出す&
これは**ウェブこすると呼ばれています**これには多くの事前のQ&Aがあります(そのうちの500本だけがPythonタグ付きです)。 Pythonでは、_twill_は_mechanize_の上にある使用可能なレイヤーです(オートメーションの場合)。実際の掻き取りについては_BeautifulSoup_です。 – smci
[twill](http://twill.idyll.org/commands.html)は、具体的には[follow](http://twill.idyll.org/commands.html)コマンドが動作するように、以下のリンクを簡単に機械化するよりも簡単にしますリンクタイトル(URLではなく)。これで問題が解決しない場合は、これらのリンクのサンプルのHTMLスニペットを表示してください。 – smci