Google BigQueryのRedditデータでデータマイニングを行っています。201704データ全体の各サブデジグルのスコアでランク付けされた1000個のポストをトップにしたいと思います。私はさまざまなテクニックを試しましたが、BigQueryの制限により、結果が大きすぎて復帰できませんでした。 select body, score, subreddit from
(
se
これまでのところ、私のコードは、サブコードの名前が与えられたときに5つの結果からHTMLコードを取り除くことに成功しました。今は、imgurリンクの検索をしたいのですが、それはアルバム用か、/ a /または一つの画像用かを問わずです。私はこのリンクを持ち上げて別のクラスに送ります(imgurdl) 私の現在のコードは何ですか? from bs4 import BeautifulSoup
impo