RStudioで大容量ファイルを扱うことができません

-1

私は、RやPythonを使用して分析を行うために必要な1.3 GBのtsvデータファイルを持っています。私のマシンには8 GBのRAMがあり、それはWindows 8を実行しています。私はRStudioやファイルを読んでアプリケーションを読み込むことができません。ファイルを読み込んで作業することをお勧めしますか？私はhadoopでAmazonに移動すべきですか？これは私のような大きなデータ問題です。RStudioで大容量ファイルを扱うことができません

出典

2016-04-04 Zack

ファイル全体をメモリに読み込まない（たとえば、行ごとに読み込んで作業していない場合は、うまくいくはずです）。ローカルでmapreduceを行う方法もありますので、Hadoopクラスタが必要なのは、データのサイズが –

であれば完全に不要です。しかし、私がRプログラムを書いているとき、それはファイル全体を処理するつもりです。だから、もし私がトップのkレコードを見ても、それは助けにならないでしょう。ローカルでmapreduceジョブを実行する方法についていくつかの情報を教えてください。 – Zack

また、私はRまたはpythonのどちらかで作業する必要があります。 – Zack

Rで読み込み中に問題が発生しました。私はpython pandasを使用して読み込むことができ、8GB RAMのコンピュータで動作しているようです。

出典

2016-04-04 19:26:57 Zack

解決策であることを示す方法でこれを書いていますが、あなたの質問にはすでに8GBがあるという。これがあなたの質問の補遺であれば、この答えを削除してあなたの質問に編集してください – Rob

私はそれを "Rで動作させることができませんでしたが、私の8GBマシンでもPython Pandas " – Gimby

@Gimbyフェア – Rob

RStudioで大容量ファイルを扱うことができません

答えて

関連する問題