提供しているコンテンツと非常に似ている約100のウェブサイトを削り取る必要があります。PHPやPythonを使ったWebスクレイピング技術
私の最初の疑問。 100のウェブサイトすべてを掻き取るための一般的なスクリプトを書くことができなければならないか、または掻き取り技術では特定のウェブサイトのスクリプトを書くことしかできません。 (ダムの質問。)私はどのような可能性があるのかを尋ねるべきだと思う。ウェブサイトごとに100種類のスクリプトを書くのは難しいです。
2番目の質問です。私の主な言語はPHPですが、ここでStackoverflowを検索したところ、最も高度なスクレイパーの1つはPythonの「美しいスープ」です。 Pythonで "Beautiful Soup"をPHPで呼び出すことは可能でしょうか?または、Pythonですべてのスクリプトを実行する方がよいでしょうか?
私はどうすればいいのかを手がかりにしてください。
私の弱い英語のために申し訳ありません。
よろしくお願いします。
PythonはPhytonではありません – Unode
Pythonはあなたのツールベルトに素敵なものになり、PHPの書き方を改善することさえできます。スクリプトがcrontabから実行される場合、Pythonが良い選択です - データベースアクセスのためのSqlSoupも見てください。 –
あなたのポストで "BeautifulSoup"を参照している、私は疑いがある、 "美しい石鹸" –