私は次のHTMLコードを含むサイトをこすりしようとしている:美しいスープで掻くスキー?
<div class="content-sidebar-wrap"><main class="content"><article
class="post-773 post type-post status-publish format-standard has-post-
thumbnail category-money entry" itemscope
itemtype="http://schema.org/CreativeWork">
これは、私が興味のデータが含まれています...私はそれを解析するためにBeautifulSoupを使ってみましたが、次のように戻りました。
<div class="content-sidebar-wrap"><main class="content"><article
class="entry">
<h1 class="entry-title">Not found, error 404</h1><div class="entry-content
"><p>"The page you are looking for no longer exists. Perhaps you can return
back to the site's "<a href="http://www.totalsportek.com/">homepage</a> and
see if you can find what you are looking for. Or, you can try finding it
by using the search form below.</p><form
action="http://www.totalsportek.com/" class="search-form"
itemprop="potentialAction" itemscope=""
itemtype="http://schema.org/SearchAction" method="get" role="search">
# I've made small modifications to make it readable
美しいスープ要素には、私の希望するコードが含まれていません。私はあまりHTMLに精通していないが、私はこれがデータを返すいくつかの外部サービスへの呼び出しを行うと仮定している..?私はこれを読んだことがあるスキーマと何かがあります。
私はこのデータにアクセスできますか?
HTMLコードから何を取得しますか? –
はHTMLテーブルです。テーブルを解析しようとすると、Noneが返されます。 –
私はまだそれを取得しません。情報を取得しようとしているウェブサイトは正確に何ですか?情報がJavaScriptによって構築されている場合、 '要求'は機能しません。 –