私はいくつかの個人データサイエンスプロジェクトを行っています。そのうちの1つは、特定の曲がラジオでどのくらい頻繁に再生されているかを見ることです。Python/RでJavaScraping JavaScriptを使用する
http://www.iheart.com/live/radio-1045-3401/
私はページのソース、関心の移入の無い値を見ると、上記のURLを見てみます。理由はわかりませんが、 "Now Playing"ヘッダーにカーソルを合わせるとchromeでinspect要素を使用すると、現在再生中の曲やアーティストの値が表示されます。
例:
a class="player-song" href="/artist/rem-3610/songs/-2450662/" title="Losing My Religion" data-reactid=".1hpdfx1l4ow.a.1.0.1.1">Losing My Religion</a
私の二つの質問は以下のとおりです。
- は、なぜこれがページのソースに表示されないが、私はそれが下の要素を点検して見ることができますか?
- ページソースにこの情報が表示されないので、どのようにこの情報をスクラップしますか?動的な要素を含んで
javacriptによってコンテンツが生成されている可能性があります。その場合、Pythonでセレンを使用することができます – juvian
おそらくそのAPIを使用してデータを取得できます。http://developer.iheart.com/Api/login –