2017-04-05 18 views
0

ウェブサイトのベースURLからすべてのリンク/ htmlページを取得したいと考えています。私は文書を読んで、それがPythonのBeautifulsoupの組み合わせを使用して達成できることを知っている。 BeautifulSoupのインストール方法やその他の前提条件を教えてください。 BeautifulSoupがインストールされたら、どのように私はそれをPythonコードで使用できますか?もしこれを実現するためにPythonコードを共有できる人がいれば、beautifulsoupウェブサイトのベースURLからすべてのリンクを取得する

+0

[Web Scraping with Python](http://stackoverflow.com/documentation/python/1792/web-scraping-with-python#t=201704051114226410689) –

答えて

0

ご質問には、お使いのOSや具体的な目標に関する情報はありません。私はすでにPythonをインストールしていると仮定しています。 pipは、Pythonパッケージを管理するコマンドラインツールです。あなたは

pip install beautifulsoup4 

beautifulsoup documentationは、より学習を始めるのに良い場所です、あなたのターミナルで以下のコマンドを実行することができます。

+0

Pythonは既にインストールされていますが、Python 2.7がインストールされています.8。私はcmdを介してeverythngをインストールしようとしています。私がコマンドpipを実行するときに、beautifulsoupをインストールすると、 'pip'が内部コマンドまたは外部コマンドとして認識されないというメッセージが表示されます。 – Nisha

0

このスニペットは、questionにあり、ベースURLからすべてのリンクを取得するのに役立ちます。

+0

これを実行していただきありがとうございますbeautifulSoupとpipが必要です。私はインストール時に問題に直面しています。それについてもっと詳細を要求するでしょう。 – Nisha

+0

オペレーティングシステムがWindowsの場合、バンドルされたモジュールとしてpipを含むpython 3.6をダウンロードするだけです。次に、あなたの環境パスにpython 3.6とpython 3.6/scriptsを追加します。次に、コマンドプロンプトからpip install beautifulsoup4を使用することができます。 – pythonlearn

関連する問題