2017-05-24 4 views
0

私は少しジレンマに陥っており、私は正しい方向を指していることを望んでいました。Gitはコード専用で、データ用ですか?

私はGitリポジトリが2つ(わかりやすい)フォルダ:scriptsdataです。私はdataで分析する新しいデータファイルを追加し続けますが、scriptsではRというスクリプトを記述してこれらのファイルを分析します。

両方のフォルダの変更を追跡します。したがって、私はdataに新しいデータファイルの追加をコミットします。これは変更を追跡することとは関係ありません。少なくとも2台のマシンで作業しているので、スクリプトとデータが一緒に動くようにしたいだけです。 私はGitを不適切に使用しているように感じます。(dataフォルダに関して)私は基本的に同期ツールとして使用しています。

私の質問:Gitをデータとして使用するのは悪い習慣ですか?

+1

リポジトリにデータを保存する際の主な問題は、データを変更するたびにGitが新しいコピーを作成することです。あなたのデータセットが大きい(MBやGBの100sなど)場合、これは本当にあなたのレポのサイズを吹き飛ばすことができます。それが小さい場合、またはそれを変更しない場合、問題はありません。 –

答えて

1

私はあなたが特にひどい何かをしているとは思わない。おそらく、自分のブランチにデータを保存して、それをサブモジュールまたはサブツリーとして使うことができますか?

関連する問題