2017-07-19 15 views
0

私は単純なプロジェクトに取り組んでおり、問題があります。私は"div player_data="から文字列を取得したいです。ここでは、このdivです:助けをPython - BeautifulSoupがplayer_dataから文字列を取得

"http:\/\/vrbx072.cda.pl\/dYXEHM8Nw3y_TZTmTs4e0g\/1500496486\/vl9afb2190473cc908d0c33cdb15bb212994083ca30c797154058bc8717c4ca746.mp4 

ありがとう:

<div id="mediaplayer60597053" 
    player_data='{ 
     "id": "mediaplayer60597053", 
     "ads": { 
     "schedule": [{ 
      "enabled": true, 
      "counter": false, 
      "skip": true, 
      "click": true, 
      "key": "", 
      "tag": "https:\/\/www.cda.pl\/xml.php?type=g_embed&get=pool&ts=1500453286", 
      "repeat": 1, 
      "time": 0, 
      "type": "pool", 
      "displayAs": "prerol" 
     }] 
     }, 
     "video": { 
     "id": "60597053", 
     "file": "http:\/\/vrbx072.cda.pl\/dYXEHM8Nw3y_TZTmTs4e0g\/1500496486\/vl9afb2190473cc908d0c33cdb15bb212994083ca30c797154058bc8717c4ca746.mp4", 
     "manifest": null, 
     "duration": "6115", 
     "durationFull": "01:41:55", 
     "poster": "\/\/static.cda.pl\/v001\/img\/mobile\/poster16x9.png", 
     "type": "plain", 
     "width": 1920, 
     "height": 816, 
     "content_rating": null, 
     "quality": "vl", 
     "ts": 1500453286, 
     "hash": "26be0bc36e8575c32ff32f4329a301889d1f6f7a" 
     }, 
     "nextVideo": null, 
     "autoplay": false, 
     "seekTo": 0, 
     "premium": false, 
     "api": { 
     "client": "json_client", 
     "ts": "1500453286_60686", 
     "key": "9a3859a86e909430bd379badfa68d0d712603626", 
     "method": "" 
     }, 
     "user": { 
     "role": "guest" 
     } 
    }' 
    tabindex="1"> 
</div> 

が、私はこの文字列を取得したいです。

答えて

1

divを取得してそこからjsonオブジェクトを抽出する必要があるように見えます。 soup.findを使用してdivを抽出し、json.loadsを使用してjson文字列をPython辞書に変換できます。

import json 

div = soup.find('div', {'id' : 'mediaplayer60597053' }) 
data = json.loads(div['player_data']) 

print(data['video']['file']) 
# 'http://vrbx072.cda.pl/dYXEHM8Nw3y_TZTmTs4e0g/1500496486/vl9afb2190473cc908d0c33cdb15bb212994083ca30c797154058bc8717c4ca746.mp4' 
+0

答えのためのThxをしかし、それは私にこの 'uggcfを与える://ieok056.pqn.cy/0r_FFJVYyyttw9jq-BHXmD/1500497686/uq9nso2190473pp908q0p33pqo15oo212994083pn30p797154058op8717p4pn746nqp.zc4 ' – jestembotem

+0

@jestembotemは補正をしました。今すぐチェックしてください。 –

+0

このコードは正しいです。私は間違いをした。 Thx – jestembotem

関連する問題