2017-11-03 5 views
0

htmlタグからJSONデータを抽出するのに時間が掛かります。具体的には、scriptタグで、JSOUPライブラリを使用して、scriptタグの間でデータを取得できます。しかし内部には私が抽出できないJSONデータがあります。Regexを使用してデータを抽出します

<script type="text/javascript">jwplayer.key="WbtWzGvcRNi6Tk+gtKldIbx+nn6lXZFvKiaO2g==";jwplayer("tvplayer").setup({playlist:[{image: "http://img.canlitvlive.io/yayin/trt1_480.jpg?1509735585",title:"TRT 1 Canlı Yayın - CanliTVLive.io",file : "http://yayin.canlitvlive.io/trt1/live.m3u8?tkn=8JD95lXv9dOUXwtgOTBYfw&tms=1509749985"}],...</script>

私は内部jwplayerあるfileタグからurl必要があります。ここではタグです。私は正規表現を使って試しました。例えば、次のようにしてみました。 "playlist[\":\\s\\{]+file[\":\\s\\{]+\"([^\"]+)\""

しかし、私は正規表現の経験があまりなく、正しいパターンを見つけられません。誰かがこれを助けることができますか?おかげ

+1

いくつかの空白を必要とします。 – CAustin

+0

'file:"(。*?) "'試してみましたか? – sln

+0

ご意見ありがとうございます。あなたがいくつかのコード例でより具体的なら@CAustin? – Yupi

答えて

1

は、私は推測している、あなたはちょうど私がHTMLパーサを使用して、JSONパーサーを使用することをお勧めし

file\s*:\s*"(.*?)"

https://regex101.com/r/4HldaP/3

関連する問題