2011-07-15 14 views
0

私が尋ねていることが可能で、私はGoogleで何を検索するのか分からない。ログインが必要なウェブサイトからデータを取得する(Java)

基本的に、ウェブサイトからデータを取得する必要があるプロジェクトが複数あります。私が今考えている例は、銀行口座からアカウント情報を取得することです。http://www.americanexpress.ca私は自分のログイン情報が左側のフィールドに入力され、結果のページ。私はそのデータを解析するメソッドを作成します。

明らかに、私は銀行情報を盗まれたくないので、これは安全である必要があります。

申し訳ありませんが、解決策が明らかな場合は、ウェブサイトからデータを取得しようとしたことはありません。

+0

検索する用語は「ウェブスクレイピング」 –

+0

ありがとうございます!私はログイン資格情報を入力し、ネストされたリンク内のデータを取得できますか? –

+0

Fiddler(http://www.fiddler2.com/fiddler2/)は、ブラウザとSSLで暗号化されたWebサイト間で渡されるネットワークメッセージのデバッグに非常に効果的です。 –

答えて

2

前述のように、Apache HttpClientは1つのオプションですが、私はいつもHtmlUnitがこのようなことを行うために(APIの観点から)より使いやすくなることを個人的に見出しました。 HtmlUnitはHttpClientの上に構築され、ページコンテンツの操作や操作のためのより高レベルのAPIを公開しています。

+0

手動で行うのと同じくらい安全ですか? –

+0

@Adam - はい。セキュアなURLをポイントすると、接続はSSLを使用します。これは、通常のWebブラウザを使用することと同じくらい安全です。 – aroth

+0

私は、HtmlUnitが "ユーザーのような"活動を自動化するのに便利だと同意しますが、HttpClientが前回のメジャーリリースでもっと良くなっていることは注目に値します。私はまた、WatirとSeleniumを固体の選択肢として投げ捨てます。 Seleniumは特に技術的ではない人にとって特に優れています。 – jkraybill

2

Apache HttpClient(または同じ)ライブラリを使用する必要があります。それはあなたのために必要なすべてのクラスを持っています。

+0

私はそれを試してみるよ、ありがとう! –

関連する問題