2017-11-02 3 views
0

異なる医師名のWebスクラップを自動化しようとしています。Rを使用して動的にウェブスクラップを実行する方法

1を.csvファイルプロセスは、私がで医師名のリストを持っていている)最初のプロセスは、医師の名前は、このsiteの検索バーに入力する必要があり、です。

2)検索ボタンがヒットします。

3)最初のリンクが選択されます。

4)その後、医者の必要な情報を収集するためにウェブの廃棄を行いたいと思います。

これは実行する必要があります。

すべての医師に同じことが適用されます。

Rを使用してこのプロセスを手助けできる人はいますか?

+0

おそらく少し倫理的に行動します。 http://www.metacrawler.com/robots.txtあなたがやっていることを禁じます – hrbrmstr

+0

このサイトでは実行できませんか? –

+0

掻き落とすことができるかどうかではなく、サイト運営者が特に禁止しているときに掻爬する必要があるかどうかについてではありません。 – emporerblk

答えて

0

Google検索で「Rを使ったウェブスクレイピング」はthis tutorialthis tutorialになりました。これらの両方は、あなたが必要とするものを達成することができるはずです。また、hrbrmstrの警告に耳を傾け、不正なメタクロラのWebサイトで必要なデータを取得できるかどうかを確認してください。

関連する問題