2016-08-22 7 views
-1

私の問題は働いています。ウェブサイトへのリンクをクリックしてから、会社名、会社の電話番号、会社の住所をExcelスプレッドシート別の列。この情報はすべてのウェブサイト上の同じ場所にあり、各リンクをクリックして情報をコピーして貼り付けなければならないため、時間がかかるだけです。異なるウェブサイトからたくさんの情報を集めるもっとも効果的な方法

私はPythonプログラミング言語について知っていますが、私は、これについての最良の方法が、その言語を使ってウェブサイトのソースを検索し、関連情報が残っているか、別のプログラミング言語。また、指導のために読むための図書館の提案はありますか?

答えて

1

リクエスト/ urllibと組み合わせてBeautifulSoupを使用して、ウェブサイトのソースコードをスクラップして解析することができます。

次に、Openpyxlを使用して、データをExcelスプレッドシートに書き込むことができます。

+0

ありがとうございました!私は今それを見るでしょう! :D –

+0

何か助けが必要な場合は、ここに返信して自由にお気軽にお返事します! – Harrison

+0

ありがとう、ありがとうございます!私は次の数日間にわたって行きたいと思っています。私から聞いてくれると確信しています:) –

0

私はこのタイプの作業にBeautiful Soup Pythonライブラリを使用しています。すべてのHTMLコードを整理して、必要なデータを簡単に抽出することができます。ここに例があります:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

+0

そのリンクに到達することはできません:/あなたは正しいですか? –

+0

私はもう一度それをクリックして、私はそれを見ることができます。 「美しいスープの文書」を検索することもできます。 – JMA

関連する問題