ghtorrent-bq
データは、しかし、それが更新されたとき、それは明確ではないと私は日付データまでBigQuery:いつGHTorrentが更新され、最新の情報を入手するには?
2
A
答えて
1
GHTorrentのみ提供(https://stackoverflow.com/a/42930963/132438に関連した)多くを得ることができるか、GitHubののスナップショットを持っているのは素晴らしいですBigQueryでのデータの定期的なスナップショットです。GitHub Archiveは毎日更新しています(または毎時更新することもできます)。
GHTorrent(おそらくhttps://twitter.com/gousiosgが役に立ちます)のスナップショットを頻繁に作成することは素晴らしいことですが、その間に両方のデータセットをマージすることができます(GHTorrentスナップショットデータを探し、GitHubアーカイブから最新の星を追加します) :
#standardSQL
SELECT COUNT(DISTINCT login) c
FROM (
SELECT login
FROM (
SELECT login
FROM `ghtorrent-bq.ght_2017_01_19.watchers` a
JOIN `ghtorrent-bq.ght_2017_01_19.projects` b
ON a.repo_id=b.id
JOIN `ghtorrent-bq.ght_2017_01_19.users` c
ON a.user_id=c.id
WHERE url = 'https://api.github.com/repos/angular/angular'
)
UNION ALL (
SELECT actor.login
FROM `githubarchive.month.2017*`
WHERE repo.name='angular/angular'
AND type = "WatchEvent"
)
)
1
理論的には、新しいGHTorrent MySQLダンプがリリースされるたびに更新されます。具体的には、CSVパーサーが処理できないユーザーの場所など、奇妙なテキストが多数存在するため、生成されたCSVに対して手動で調整する必要があります。
関連する問題
- 1. jQueryの最新の情報に更新
- 2. 最新情報を入手するFacebookログアウト
- 3. Piwikについての最新情報
- 4. Magentoの最新の製品情報を入手
- 5. 更新されたテキストボックス情報をDBに更新するC#
- 6. リダイレクトリンクが更新されずに新しい情報が取得される
- 7. $ scopeが更新された後、ng-repeat情報が更新されない
- 8. githubの更新されたファイル情報
- 9. デバッグ時にプリンタの情報が更新されない
- 10. HealthKitが更新された情報を返さない
- 11. Xamarin Androidの最新の情報に更新断片
- 12. 電話中に位置情報が更新されない
- 13. Telegram Bot APIで最新の更新を入手する方法
- 14. ThreadViewからの新しい情報でTableViewが更新されない
- 15. Ajaxian以外のJavascriptとAJAXの最新情報を入手するのに良いウェブサイトは何ですか?
- 16. SQL、最新のデータ情報
- 17. スイッチングディベロッパーの最新情報
- 18. Nativescriptの位置情報サービスでダッシュボードが更新されない
- 19. Syliusデータベースの資格情報が更新されない
- 20. 情報を入手する
- 21. PHP - 新しく作成されたユーザーからの情報の入手方法
- 22. Trello APIで最近更新されたカードを入手するには?
- 23. 更新後のトリガー情報
- 24. PDOユーザー情報の更新
- 25. Google +最新情報一覧
- 26. 指定されたセッションの情報を更新する
- 27. データベースを更新すると、挿入すると情報が挿入されない..... vb.net
- 28. 情報が正しく入力されないと、即座にページが更新されます
- 29. 更新ユーザー情報(春ブーツ)
- 30. ローカルgithubアカウント情報を更新する