2016-12-09 6 views
0

HTTPartyとNokogiriを使用してLinkedInプロファイルから誰かのフルネームを取得しようとしています。なんらかの理由で、HTTPartyは実際のLinkedIn HTMLページを返していません。それは全く違うものです(私の端末の出力を見てください)。このコードを他のURLで試してみましたが、うまくいきます。何か案は?HTTPartyがLinkedInページを返さない

ここに私のコードです:

# Store the LinkedIn URL form command line. 
linkedin_url = "https://www.linkedin.com/in/janedoe" 

# Get the contents of the LinkedIn page. 
page = HTTParty.get(linkedin_url) 

p page.parsed_response 

enter image description here

EDIT:が判明、私は戻って取得していたHTMLページは、単にリダイレクトを作成するスクリプトが含まれ - どのように私上の任意の提案を最終ページに達することができますか?

答えて

1

これはページです。これはHTMLで、別のページにリダイレクトします。ブラウザの指定されたリンクに移動し、リダイレクトされているかどうかを確認します。存在する場合は、指定したURLがリダイレクトされるリンクを使用します。それもHTMLです。 HTMLの構文解析に手助けが必要な場合は、REGEXを使用しないでください。

+0

リダイレクトURLを組み立てる条件ロジックがたくさんあります。私はちょうどそのwindow.onload関数を実行できる方法はありますか? – Gundam194

+0

@ Gundam194 RubyのHTMLパーサを研究します。そのHTMLからリダイレクトされたURLを計算するプログラムをコーディングすることができない限り、私が提案したものが最良の解決策です。 – NoOneIsHere

関連する問題