2016-11-06 9 views
0

私は特定のウェブページ(「Bitcoin」)のWikipediaページビューの統計情報で過去5年間の時系列データを収集しようとしています。私はこのサイトが有用であることを発見した:http://stats.grok.seこのデータを取得する。 2つの問題:ウィキペディアのページビューの統計情報を取得する

  1. データを取得する年として2016が選択されると、Webサイトで「内部サーバーエラー」エラーが発生します。

  2. この出力を.csvなどのより使用可能な形式にすることができる既存のツールはありますか?

答えて

2

私はstats.grok.seについては知りません。ウィキメディアプロダクションまたはラボサーバーには表示されません。 https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia.org/all-access/all-agents/Bitcoin/daily/20151105/20161105

すべてのアクセス=デスクトップ+モバイルウェブ+モバイル:一年間https://en.wikipedia.org/wiki/Bitcoin

https://wikimedia.org/api/rest_v1/#!/Pageviews_data/get_metrics_pageviews_per_article_project_access_agent_article_granularity_start_end

例えば、毎日のページビュー:しかし、2015年7月に開始ページビューの統計のために提供されるAPIがあります-app

すべてのエージェント=ユーザー+クモ+ボット

履歴データはhttps://dumps.wikimedia.org/other/pagecounts-raw/

からダウンロードすることができます彼らは様々な期間をカバーする他のいくつかのソースをリストページの一番下に https://dumps.wikimedia.org/other/pagecounts-raw/

+0

これは素晴らしいです!ありがとう – Parseltongue

1

私は2007年からここに2016年までのページビュー統計のアーカイブを発見しました。

関連する問題