0
私は少しジレンマに陥っており、私は正しい方向を指していることを望んでいました。Gitはコード専用で、データ用ですか?
私はGitリポジトリが2つ(わかりやすい)フォルダ:scripts
とdata
です。私はdata
で分析する新しいデータファイルを追加し続けますが、scripts
ではR
というスクリプトを記述してこれらのファイルを分析します。
両方のフォルダの変更を追跡します。したがって、私はdata
に新しいデータファイルの追加をコミットします。これは変更を追跡することとは関係ありません。少なくとも2台のマシンで作業しているので、スクリプトとデータが一緒に動くようにしたいだけです。 私はGitを不適切に使用しているように感じます。(data
フォルダに関して)私は基本的に同期ツールとして使用しています。
私の質問:Gitをデータとして使用するのは悪い習慣ですか?
リポジトリにデータを保存する際の主な問題は、データを変更するたびにGitが新しいコピーを作成することです。あなたのデータセットが大きい(MBやGBの100sなど)場合、これは本当にあなたのレポのサイズを吹き飛ばすことができます。それが小さい場合、またはそれを変更しない場合、問題はありません。 –