私たちはLinuxのプロダクションサーバーと、スクリプトを実行してデータを収集してSparkデータレイクに入れるスクリプトを用意しています。本番環境で実行されているRスクリプトのベストプラクティスコーディング
私の背景はSQL Server/Fortranであり、非常に具体的なベストプラクティスがあります。
- プロダクション環境では、バージョン管理の点で安定であるべきであり、その両方などビューのコードポイントだけでなく、インストールされたアプリケーション、オペレーティングシステムからのコード/アプリケーション/オペレーティングシステムへ
- 変更が行われるべきです別の環境または制御された方法で行われ、がバックアウトされてになる可能性があります。
- 第2の環境が存在する場合、システムの変更をテストするための並列実行の可能性が実行できます。
- は(主に)、開発者はRコードの見直しでは、本番環境
を変更することが制限されている、私が質問を持っているものがいくつかあります。
- library()、install.packages() - スクリプトを実行するたびに新しいバージョンのパッケージをインストールする可能性を除外したいと思いますか?
- CRONジョブでスケジュールされたRパッケージを呼び出すにはどうすればよいですか?ここにはいくつかの選択肢があります。
- RSeleniumを使用する場合、gui/webブラウザまたは仮想化されたWebブラウザを使用する最も効率的な方法は何ですか?
あなたのRの質問は、まだ広すぎると漠然としているため、簡単に答えられないと私を驚かせます。この質問がうまくいく場合は、より具体的な詳細を提供する必要があると思います。 – joran
最後の3つの箇条書きは、明確に別々の質問です。 – lmo
'install.packages'を自由にコメントアウトしてください。 Rは、あなたが紛失した場合、あなたのチャグリンに利用可能なものを使用するか、エラーを生成します(あなたが明示的にそれを捕まえない限り)。 –