2017-06-28 5 views
-1

gittubコードの検索結果をログファイルにダウンロードするためにwgetを使用しようとしています。私はしかし、下記の言うrobots.txtファイルを得るのですかgit hub検索結果のダウンロードにwgetを使用できません

wget -o logfile -r -l 2 https://github.com/search?l=Dockerfile&q=openjdk&type=Code&utf8=%E2%9C%93 

:私は、次のコマンドを使用してきた

あなたはGitHubには、ご連絡クロールしたい場合

[email protected]

#我々はまた、大規模なAPIを提供:https://developer.github.com/

私はこのためにgithubのから許可のいくつかの並べ替えが必要ですか? 誰かを助けることができますか?

答えて

-1

私はメッセージがかなり明確だと思います:GitHubサイトをクロールしようとしていて、彼らはそれを気に入っていません。

GraphQL APIを使用することをお勧めします。

v3 APIはまだRESTあるので、あなたのような何かを行うことができます:

wget --output-document search-results.json --user <YOUR_GITHUB_ID> \ 
"https://api.github.com/search/code?q=openjdk+language:Dockerfile" 
関連する問題