ウェブページ上のすべてのURLを調べて、urllib2で個々の変数に保存するには?ウェブページ上のすべてのURLを探し、それをurllib2で個々の変数に保存するには?
0
A
答えて
1
はhtml parserでHTMLを解析し、すべてを見つける(例えば肌触りスープのfindAll()
メソッドを使用して)<a>
タグとそのhref
属性を確認してください。
ハイパーリンクでなくてもページ内のすべてのURLを検索する場合は、simpleからridiculously insaneまでの正規表現を使用できます。
0
あなたはurllib2だけでは実行しません。あなたが探しているのは、WebページのURLを解析することです。 urllib2を使って最初のページを取得し、その内容を読んだ後、Beautifulsoupのようなパーサーに渡すか、他のポスターが説明されているように、ページの内容を正規表現で検索することもできます。
0
urllib2で未処理のhtmlをダウンロードしてから、簡単に検索することができます。簡単な方法があるかもしれませんが、これを行うことができます:
1:ソースコードをダウンロードしてください。
2:文字列ライブラリを使用してリストに分割します。
3:各セクションの最初の7文字を検索 - >
4:最初の7文字がhttp://の場合は、変数に書き込みます。
なぜ別の変数が必要なのですか? list.append(URL_YOU_JUST_FOUND)を使用して、別のURLが見つかるたびにそれらをすべてリストに保存する方が簡単ではないでしょうか?
関連する問題
- 1. @ngrx DBのコレクションに個々のアイテムを保存するには
- 2. ウェブページのコンポーネントを別々のファイルに保存する方法
- 3. ウェブページ上にファイルを保存する
- 4. MYSQLから個々の値を取得してJavaScript変数に保存する方法は?
- 5. PHP/MYSQL - テーブルフィールドを個々の文字列変数として保存
- 6. マットファイルの個々の内容に複数のndarrayを保存する - scipy
- 7. Gitリポジトリ内の個々のファイルに対してカスタムメタデータを保存する
- 8. コアデータに個々のエンティティを保存する方法
- 9. 個々の日を配列に入れて保存する方法
- 10. ウェブページのすべてのリンクを短いURLに変換するには?
- 11. Datagridviewチェックボックスはすべてを選択し、各セルをそれ自身の変数に保存しますか?
- 12. ウェブページ内の文字列をファイルに保存せずに探しますか?
- 13. 個々の文字を要求するパスワードシステム - それらは何を保存しますか?
- 14. .dir-local変数を別々のディレクトリに保存する方法
- 15. pulseaudioは個々のポートのボリューム情報をどこに保存しますか?
- 16. oracle sql(toad) - 複数のクエリを実行し、個々のExcelファイルに保存
- 17. 配列または個々のフィールドとしてデータを保存する(PHP/MySQL)
- 18. 配列インデックスの個々の値を親インデックスに保存するにはどうすればよいですか?
- 19. Androidのlistpreferences、個々の設定を保存する方法
- 20. javascriptを使用してJSON配列を個々の変数に変換する
- 21. 永遠にウェブページのすべての効果を保存します
- 22. 数式を個々の変数の式に変換するにはどうすればよいですか?
- 23. ページ上にURLハッシュを保存する
- 24. ファイルに検索文字列を探して、変数に保存する - TCL
- 25. 変更を保存し、既存のオブジェクトをEntity FrameWorkで更新し、個々のプロパティを個別に設定する必要はありません。
- 26. Chrome - LocalStorage - すべてのURLに値を保存する
- 27. 基礎となる変数を指定せずに個々のTensorFlowレイヤを保存する
- 28. VBAコードが個々のシートを保存しないのはなぜですか?
- 29. ウェブページを保存するには
- 30. 個々のDBフィールドを保護する
なぜ個々の変数に格納するのですか?何らかのコレクションが正しいデータ構造である「リスト」のように聞こえる。 –
の可能な複製は何ですか?[pythonを使用してウェブページ上のURLのリストを抽出する簡単な方法は何ですか?](http://stackoverflow.com/questions/4139989/what-is-a-simple-way-to-extract-ウェブページ上でのURLのリスト(リスト) –