2017-02-15 14 views
2

誰かが私のカールでこのリンクを解析する必要がありますどのように私の助けてもらえますか?LinkedInのページを解析する方法

https://www.linkedin.com/in/williamhgates/

そして、これは私のコードです:

ちょうどそれを実行し、結果を見て:

$url = "https://www.linkedin.com/in/williamhgates/"; 
$ch = curl_init($url); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true); 
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); 
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Host: www.linkedin.com/in/williamhgates/')); 
$output = curl_exec($ch); 
curl_close($ch);dd($output);die; 

私はちょうどファイル内のソースの全部を取得したいが、それは示してい:

Could not process this client request HTTP method request for URL 
+0

おそらく、ユーザーエージェントのような見出しが見つからないことがあります。 – Jer

+0

私はhtml_domとcurlで別の方法を試してみましたが、どれもうまくいきません! – Hamed

+2

php.iniでfile_get_htmlが有効になっている場合は、 '$ html = file_get_html(https://www.linkedin.com/in/williamhgates/ ');'を使用して、そこからDOMクラス抽出データを使用することができます。 –

答えて

0

リンク先ではいくつかのクローラを除くすべてのクローラを許可していませんそれらのトラフィック(Google bot、Bingbotなど)を送信し、ユーザーエージェントを明示的にブロックしました。 Linkedinページにカールリクエストをすることはできません。 それでもLinkedinをクロールすることができれば、法的問題が発生する可能性があります。したがって、Linkedinを単独で離れる方がよいでしょう。

0

標準的な方法はLinkedInではもう機能しません。
リンク先のページをiframeに配置しても機能しません。 Load denied by X-Frame-Options: https://www.linkedin.com does not permit cross-origin framing.
Feed43が約5週間前まで動作していたと回答しました。現在はHTTP/1.1 999 Request deniedという応答を得ています。

あり、サイト上のLinkedInのユーザー・プロファイル・ウィジェットを取得するための公式のLinkedInのプラグインです - https://developer.linkedin.com/plugins/member-profile

そして、いくつかの他のプラグインも同様に - https://developer.linkedin.com/plugins

しかし、それはあなたがこれらの日を取得すべてです。

関連する問題