2017-08-22 11 views
0

これは、世界の終わりではないにしても、有益で時間を節約できる問題について不思議です。Rスクリプトおよび/またはRセッション(環境)を分割する

私はちょっと調べましたが、文字通り欲しいものは見つかりませんでした。また、 Running multiple R scripts/sessions 私はこのリンクをチェックしましたが、もう一度私を助けません。

私は大きなデータセットを使用しています(使用しようとするテストデータは約6.5m行と50列ですが、データセットをRに実装するのも難しいです。 (データを操作してその動作を理解する方法を見てみよう。そして、6.5mの行のすべてではないにしても、大きなデータセットで行ったすべてのものを、これらのモデルと操作を統合したいと思う。

とにかく、私のR環境にも大きな問題があります。データが非常に大きいので、勤勉で大きな仕事が必要です。コードスクリプトは3500行に似ており、15%もありません。問題は、新しいデータセットの作成、新しいモデルの割り当て、適切性チェックのモデル化、新しいモデルの作成、私は環境に新しいものを必要とし、私の環境は750mb(Rセッション/プロフィール)に似ています。私は、Rのスクリプトや環境を分割すると、環境の大きさ(プロファイル)を小さくすることができると期待していました。

いずれのアイデアも素晴らしいでしょう。助けを求められた。

編集:クリーンなスクリプトを作成し、クリーンな環境で起動した後、データベースの実装はエラーなく行われました。私のようにこの実装の問題に苦しんでいる人のために。しかし、これを伝えていないのは唯一の正確な方法です。

+1

"私の環境は750mbのようです"これはかなり小さいです。あなたの質問はあまり明確ではなく、ちょっと散歩しています。私はあなたがパッケージを構築することをお勧めします(これはまた、プログラミングプログラミングのパラダイムに従わなければならず、複雑な地球環境に役立つでしょう)。 – Roland

+1

650万x 50は本当に巨大ではありません。これですでに問題が生じている場合は、RAMを増やすためにエレクトロニクス店に行くことをお勧めします。 – Roland

+0

私は同意する、私は複数のGBのサイズで単一のプロットオブジェクトを持っていた。 Rで大きなデータを扱うときは、少なくとも16GBのRAMが必要です。 – LAP

答えて

0

私は通常、特定のワークスペースを生成するスクリプトを作成し、すべてのスクリプトと保存されたワークスペースへのパスを含む別のスクリプトを保持します。

は、このスクリプトを想像:

## Dataset x 
# Run script to create dataset x 
source("pathtoscript.R") 

# Save dataset x environment 
save.image("pathtodatasetx.Rdata") 

# Load dataset x environment 
load("pathtodatasetx.Rdata") 

私はすぐに実行して、私はすべての変更を行った場合は、環境を保存するか、またはちょうど私の現在のセッションにロードすることができますこの方法。

関連する問題