Diggのようなリンクをアップロードできるウェブサイト上に機能を作成しようとしています。ユーザーが自分のWebサイトにアップロードしたURLからHTMLソースコードを取得し、.txtファイルに保存するコードがあります。次に、このタグが存在すると仮定して、PHPを使用してHTMLファイルからメタデータを取得するにはどうすればよいですか?
とします。ときどき動作しますが、それ以外のときは動作しません。特定のWebページのソースコードに、自分のコードで指定したのと同じように必要なメタタグが含まれています。 "GRAB THIS"のコンテンツにhtmlエンティティ(&など)が含まれていると正しく動作しないようです。これをどうやって動かすかについてご意見がありましたら教えてください。私はMySQLのデータベースでこれを置くので、私のコードの休憩後、
$html_data = file_get_contents($path_to_txt_file_that_contains_html);
preg_match('#<meta name="description" content="(.+?)">#si', $html_data, $tor;
$tor = str_replace ('<meta name="description" content="' , "", $tor[0]);
$tor = str_replace ('">', "", $tor);
は時々$ TORはまだ
<meta name="description" content="CONTENT"
が含まれていますが、閉じずに>:ここに私のコードです。私が間違っていることに関するアイデアは?どんな助けもありがとう!
あなたはHTMLで正規表現を使用しています。 –