Gitはバイナリデータで問題ありません。例えば、多くのプロジェクトは、例えば、 git reposの画像
私の経験則では、バイナリファイルがソースマテリアル、外部依存関係、または中間ビルドステップであるときはいつでも決定することになります。もちろん、厳しい規則はありませんので、あなたがそれらについてどのように感じているかを決めるだけです。ここに私の提案は以下のとおりです。
彼らは(再現性)何か、.gitignore
からバイナリを生成し、必要なデータを構築するスクリプトを持っている場合。同じ場所にあっても別の場所にあっても、最高の気分になるでしょう。
いくつかの外部ソースから取得された場合、同じロジックが適用されます。外部ダウンロード。通常、依存関係はリポジトリに格納されません。リポジトリへの参照のみが保持されます。例えば。私たちはvirtualenvsを持っていませんが、requirements.txtファイルしか持っていません - Javaの世界の類推は、.jarsを持たず、pom.xmlまたはbuild.gradleの依存関係セクションだけのような(おおよその近似)です。
例えば、それらがソース物質であると考えることができる。エディタとしてPythonでそれらを操作する場合、ファイルのバイナリの性質について心配せず、それらをあなたのリポジトリに入れてください。
実際にソース資料ではありませんが、生成プロセスが実際に複雑であるか、または非常に長くかかる場合、ファイルは定期的に更新されることはありません - ひどくないと思いますレポでそれらを持っている間違っている。ファイルがどのように生成されたかについてのメモ(README.txtなど)を残すことは、もちろん良い考えです。
ああ、ファイルが大きい(数百メガバイト以上のような)場合は、git-lfsを見てみることを検討してください。
[セキュリティとメンテナンスの制限](http://scikit-learn.org/stable/modules/model_persistence.html#security-maintainability-limitations)を読むと、ピクルスの使用に疲れてしまいます。 –