私はbs4とurllibを使用してGoogle Scholarのデータをスクレイピングしています。私は記事が出版される最初の年を取得しようとしています。たとえば、this pageから私は1996年を取得しようとしています。これは棒グラフから読み取ることができますが、棒グラフをクリックした後でなければなりません。私は次のコードを書いたが、棒グラフがクリックされる前に年を表示する。 from bs4
私が必要としているすべてのデータを取得してcvファイルに保存すると、出力はUTF-8形式になります。 'm wrong') TBH私はすでに.encode()と.decode()オプションを使って "再生"しましたが、結果はありません。 は、ここに私のコード brands=[name.text for name in Unibrands]
は、ここに出力 u'Spirulina \u0395\
.select()要素を使用すると、CSSセレクタに基づいてWebページから要素を取得できますが、Webページ全体を検索します。 .select()はどのように使うのですか?特定の要素の子だけを検索します。例: <!-- Simplified example of the structure -->
<ul>
<li>
<div class="foo">foo conten