2011-09-10 15 views
1

FacebookのURLにステータスを入力するときやコメントを残すときに誰もが知っていると確信しているので、タイトルと一緒に記事から自動的に画像を取得する私が思うメタ記述。Facebookの機能に似ているWordPressのサイトにwebスクレーパーを追加する

ビルドしているサイトに、このような機能を実装したいと思っています。唯一の問題は、どこから始めるべきかわからない!

理想的には、webisteに専用のページを用意して、他の関心のある記事にリンクしたいと考えています。私はちょうどイメージ、タイトル、説明的なテキストの数行を表示したいと思います。タイトルはソースに直接リンクします。

私に助けとなる助言や指摘がある人はいますか?あなたが持っているヒントを頂ければ幸いです。これは役立つかもしれ

感謝

-J

+0

ない答え、ちょうどちらほらあり - Facebookがオープングラフプロトコルと呼ばれている対象の方法でページからその情報を取り出すことができます標準:http://ogp.me –

+0

おかげで、感謝し、あなたのコメント。私はOpen Graph Protocolを知っており、実際に必要な情報を抽出するのに役立ちます。 – jaffa

答えて

0

http://net.tutsplus.com/tutorials/php/html-parsing-and-screen-scraping-with-the-simple-html-dom-library/

チュートリアルでは、ファイルまたはURLからHTMLコンテンツをパーサーにPHP Simple HTML DOM Parserを使用しています。

+0

このリンクをお寄せいただきありがとうございました。私はそれを見つけてブックマークしました。それを見て、うまくいけば、一緒に何かを開始することができます。もう1つの質問ですが、これはプラグインとしての機能に組み込まれる必要がありますか? – jaffa

0

もう少し前に何かする必要がありましたが、これを達成するためにJquery(プロキシとしてのphp)を使用しました。

<script type="text/javascript"> 
$(document).ready(function() 
{ 
$("#statusbox").keyup(function() 
{ 
var content=$(this).val(); 
var urlRegex = /(\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/ig; 
var url= content.match(urlRegex); 
if(url.length>0) 
{ 
$("#statusbox").slideDown('show'); 
$("#statusbox").html("<img src='ajax_loader.gif'>"); 
// php proxy to get details of the page (bypass cross domain thing) 
$.get("proxy.php?url="+url,function(response) 
{ 
var title=(/<title>(.*?)<\/title>/m).exec(response)[1]; 
var logo=(/src='(.*?).jpg'/m).exec(response)[1]; 
$("#statusbox").html("<img src='"+logo+".jpg' class='img'/><div><b>"+title+"</b><br/>"+url) 
}); 

} 
return false; 
}); 
}); 

これを向上させることができることを確認して... やPHPファイルは、他のより良い方法は、カールを使用し、使用してPHP自体を使用してWebページの内容を取得することです

<?php 
if($_GET['url']) 
{ 
$url=$_GET['url']; 
echo file_get_contents($url); 
} 
?> 

のような単純なことができより良いHTMLパーサは...

別の溶液(有料無料+)が使用することですEmbedly

編集: ところでEmbedlyがworpress plugin ..

関連する問題