2012-02-03 10 views
1

preg_match_all( "/ \(。*?)\ </a"/"、$ this-> page [" Title "]、$ matches);preg_match_all imdbページでジャンルを取得するためのクエリ

ガール、$ this-> page ["Title"]は、http://uk.imdb.com/title/tt1285016/のようなページのコンテンツです。私は映画に関連付けられたジャンルのリストを取得する必要があります。ドラマ| Sci-Fi]

正規表現については、私は知りません。私はいつもパターンマッチングが嫌いです

ここで本当に感謝します。どうも。

ポイント:これは私が修正する必要がある既存のコードです。これはPHPのです。

+0

関連:http:// st ackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Lix

+0

これは別の「私の正規表現を書く」質問だと思います。ジャンルで必要な正確なブロックを抽出してください。少なくとも試してみてください!あなたが提供した正規表現は壊れているように見えます。たとえ正しい場合でも、末尾の文字列はと一致します。 – Evert

+0

正確な正規表現は投稿できません。パーサーはそれを取っていません。 –

答えて

1

この

preg_match_all('#/genre/[^>]+>([^<]+)<#',$this->page["Title"],$matches); 
+0

ありがとうございます - これは本当にうまくいきました - –

2
をお試しください

これはうまくいくはずです:

preg_match_all("@<a href\=\"/genre/[\w\-]+\"[^>]*\>(.*?)\</a>@",$this->page["Title"],$matches) 
+0

http://sourceforge.net/projects/imdbphp/から最新のIMDBスクラップを入手できます – Imtiaz