2017-05-26 4 views
0

Rで大量かつ複雑なワークフロー(多数の初期入力、記録、マージ、削除された観測など)があり、各入力に固有の多くの独立した関数タイプ、各マージおよびデータ操作ステップなどが含まれます。現在、最終的な「分析データセット」のみが地球環境に戻されます。関数内でデータマングングが発生したときのknitrドキュメントの作成

しかし、データアセンブリプロセスを文書化するknitrドキュメントを作成したいと思いますが、さまざまなオブジェクト(データフレーム/ティブル)はすべて、組み立てられた関数のローカルです。

のオプションがあるように見える:私は、地球環境への暫定的なデータオブジェクトの多くを生成することができ

  • が、それは私が

  • をきちんと維持したいと考え、地球環境を、煩雑にします関数から地球環境への興味深い属性のリスト(N、成功情報、構造体などをマージ)を返すことができました。もう少し素敵ですが、完全に効率的ではありません。

これは明らかに新しい問題です。私は最善の方法についての提案を歓迎するでしょうか?

答えて

0

class属性を持つオブジェクトを返し、それらのクラスの印刷メソッドを定義します。メイン文書で、オブジェクトを印刷します。これがこの問題に対する標準的なアプローチです。

1

knitr::spinとお考えですか?エンドファイルのレンダリング方法を定義するために使用される3種類のコメントがあります。

行の先頭に標準Rコメント
  • #'は、データ・assembly.Rスクリプトを記述して、呼び出すことにより値下げ
  • #+チャンクオプション
  • としてレンダリングされます

    1. #knitr::spin("data-assembly.R")。必要な詳細を提供する.htmlファイルが生成されます。

      例のデータassembly.Rファイル:

      #' # Data Assembly Process 
      #' This document provides details on the construction of the final analysis data 
      #' set. 
      #' 
      #' The namespaces needed for this work are: 
      #+ message = FALSE 
      library(tidyverse) 
      
      #' Our first step is to read in the data sets. For this example, we'll just use 
      #' the `mtcars` data set 
      mtcars 
      
      #' A summary of the `mtcars` data set is below 
      summary(mtcars) 
      
      #' Let's only use data records for cars with automatic transmissions 
      mt_am_cars <- dplyr::filter(mtcars, am == 1) 
      mt_am_cars 
      
    +0

    うーん。私は多くの小さな機能(1つの "should")に入力を壊し、すべての機能を取り除くために怠惰です。私は呼び出し環境にいくつかのオブジェクトを返さなければならない、あるいは少なくとも入力ファイルに関する情報(レコード数、日付時刻スタンプなど)でポーリングされたリストを返さなければならないと思います。これらのオブジェクトがリストとして返されると呼び出し環境では、私はそれらを私のレポートに組み込むことができます。私はこれが解決策だと思う。私は1日ほどで実例を投稿し、このスレッドをまとめます。 – user2292410

    関連する問題