2016-06-28 4 views
0

この質問は私のインタビュー中に私に聞かれ、私はそれを実装するように頼まれました。次のように質問です:LinkedInのプロファイルのユーザー名とパスワードを取るだろうURLからデータを取得するには

アプリケーション

  1. 、ページwww.linkedin.comで
  2. 、ページにログインするためにそれを使用します。
  3. プロファイルのクリックをシミュレート - >プロファイルの編集メニュー
  4. 下にあるそのユーザーのページを、以下の形式でスクラップし、テキストファイルにダンプします。 (ヒント:美しいスープライブラリーを使用できます)

このURLを取得するには、次の情報を読んでcsv/excelファイルに入れる必要があります。

私はそれについての手がかりがなく、インタビュー後に少し落ち込んでいるように感じました。誰かが私にそれをする方法のアイデアを与えることができますか?これはjavaのみを使用して行う必要があります。

+0

あなたドンを探る必要がありますあなたが1つを知らない場合には解決策を提示する必要がありますが、あなたが問題に取り組む方法についてのヒントを与えるだけです。このためのオートメーションソフトウェアはおそらく存在すると言えますが、あなた自身で実装する場合は、URLスキームやページのコードソースなどを調べないとapiが存在するかどうかを調べることを提案できます。インタビュー学問的な試験ではありません。デベロッパーのリクルートメントは、何か問題を抱えて話してみる人がいるかどうかを探します。 –

+0

場合によっては、採用担当者が実際に探している開発部門の手掛かりがありません。 – Fildor

答えて

0

私はこの問題を解決するようなSelenium http://www.seleniumhq.org/のようなWebブラウザ自動化ソフトウェアを使用したいと思います。そのバインディング(Java、C#、Ruby、Python、JavaScript)のいずれかを選択してソリューションを実装できます。

は、それがWebクローラーに関連すると思われる、と我々は非常によく、この使用JSOUPライブラリーを行うことができますチュートリアルhttps://www.airpair.com/selenium/posts/selenium-tutorial-with-java

+0

これはjavaのみを使用して行う必要があります –

0

を見てみましょう。 あなたはJSOUPライブラリを使用して実装を読まなければならないと我々は

https://www.linkedin.com/profile/edit?trk=nav_responsive_sub_nav_edit_profile「ここ

あなたは我々が使用することができますedit_profileなどのキーワードを持っている参照の場合のようなものを持っているリンクを除外することができます我々が必要との結果をフィルタリングする。

リンクuが続き、このような場合にはJSOUP詳細 Webcrawler using JSOUP

関連する問題