2016-08-18 20 views
0

私は現在、VBで書かれたWebスクラップツールとWebブラウザコントロールを使用しているSharePointサイトを持っています。それは信じられないほど遅く、私はそれを更新しようとしています。 HTMLAgilityPackなどのツールキットを使用してドキュメントをDOMにロードし、実際のWebページを読み込む代わりにhtml要素を使用するだけで貼り付ける/クリックすることはできますか?ブラウザコントロールを使用しないWebスクレープ?

+2

の使用方法についてのリンクです。それはSharePointだからといって、おそらくIE 6や何かがぎこちなく機能しなくてもかまわない。より効率的な方法は、HTTPリクエストを作成することですが、SharePointを使ってHTTPリクエストを行うことは幸いです。 –

+0

何を掻き取ろうとしていますか?ペースト/クリックボタンはどういう意味ですか? –

+0

私たちは、Sharepointの名前/説明/関連情報を入力して、アプリケーションをクリックして、ウェブブラウザのコントロールを通して、SharePointサイトの作成を自動化します。 sharepointがオンになっているサーバにアクセスできないため、sharepoint dllを使用してこれをプログラムで処理することはできません – Criel

答えて

0

可能な解決策の1つは、selenium web driverというNugetパッケージを使用することです。このパッケージの機能は、ブラウザ(IE、Firefox、Safari、Chromeなど)を制御することで、ウェブブラウザのコントロールと同じように動作します。セレンの使用は、Webブラウザコントロールと同じくらい遅い場合もあります。あなたは、HTMLアジリティパックなどのパッケージを使って言及しました。これはうまくいくでしょうが、あなたが間違っているところはまだページをロードしているということです。あなたはそれを見ていない。ここで

は、あなたが「ペースト/ボタンをクリックし、」したい場合は、おそらく全体のWebブラウザを実行する必要がありますselenium

関連する問題