私はGoogle Scholarのデータをスクラップするプロジェクトに取り組んでいます。私はカテゴリー(例えばAnaphylaxis)でタグ付けされたすべての著者を掻き集めて、引用数、h-indexとi-10インデックスをCSVファイルに保存したいと思います。しかし、私はGoogle ScholarにAPIがないので、これを行う方法は不明です。私は美しいスープのようなスクレーパーを使うことができると理解していますが、ブロックされずにデータをスクラップする方法は不明です。Google Scholarのタグに基づいて作者を掻き立てる
私の質問は、bs4を使用して、アナフィラキシーとしてタグ付けされたすべての著者とcsvファイル内の各著者の引用、h-インデックスおよびi-10インデックスをどのように保存できるかです。
質問は何ですか? – Peaceful
@Peaceful明確にするために更新しました – user7339949
かなり面白いですね!私は、特にブロックされているという答えはありません。しかし、おそらくあなたはhttps://pypi.python.org/pypi/scholarly/0.2.2を見たことがありませんか?これらの結果にコードをパターン化することができます。 –