2016-09-19 16 views
-1

私は彼らが持っている(定格10)投票の数に基づいてIMDb映画を並べ替そうとしています。
残念ながら、FTPサーバー上のパブリックデータセットでその情報を見つけることはできません(これはレーティングファイルに含まれていません)。
私が抽出しようとしている情報の例: The Shawshank Redemptionには10評価の955769票があります。
これは他の方法がありますか? IMDbPyヘルプができますか?IMDbのデータセットは映画のために10の評価を見つけます

答えて

0

IMDbPYパッケージを使用して評価情報を取得できるはずです。

リンクIMDbPYに示す手順に従ってください。あなたは、実際には2つの方法でそれを行うことができます

  1. はストレートフォワード方式(API呼び出しの数が少ない場合に動作します)ですが提供APIを使用してください。
  2. 複数のAPIコールがある場合は、ローカルIMDbデータベースを作成する必要があります。データベースにテーブルを自動的に作成するIMDbPYによって提供されるPythonスクリプトを実行することで(hereの手順に従います)、これを実行できます。

他の方法(推奨しません)は、厄介なプロセスであるウェブスクレーパーを作成することです。 のリクエストでbeautifulsoup pythonでパッケージを作ることができます。

+0

ありがとうございます。私は何とか(投票のパーセンテージ)ファイルから10レーティングの大まかな数を取得する方法を考え出した、私はちょうど各映画のためにそれらを計算し、並べ替えるために新しい列に入れておく必要があります。私はIMDbPYでそれをやろうとします。 –

関連する問題