reproducible-research

    1

    2答えて

    関数、引数、および戻り値の名前をプログラムで解析できますか? drakepackageでRデータ解析ワークフローを自動化するためのワークプランデータフレームを生成することに興味があります。 workplan関数を使用してそのような作業計画のデータフレームを生成することができます。 私は、使用したい機能を備えたRスクリプトを持っています。例: funA <- function(x){ y

    0

    2答えて

    私はsklearnのランダムフォレストを使用しています。私はいくつかのモデルを比較しようとしました。それから、ランダムフォレストがと同じシードの異なる結果を与えていることに気付きました。私はそれを両方の方法で試しました:random.seed(1234)とランダムフォレストの組み込みrandom_state = 1234 どちらの場合でも、私は反復不可能な結果を​​得ます。私は何を逃したのですか.

    11

    1答えて

    RStudio、R Markdown、Latex、およびPandocを使用してデータを消去し、変数を構成し、分析を実行し、結果を報告しています。私は再現可能な研究の概念には新しいですが、私は夢中になっています。たくさんの意味があります。 ダイナミックな表と数字は問題ありません。しかし、動的なテキストは、私を困惑させています。インラインコードを挿入して、すべての統計の95%が偽であると言うことができ

    0

    1答えて

    私は再現可能なデータサイエンスワークに非常に興味があります。そのために、コード、データ、環境の設定を束ねるプラットフォームとしてDockerを探求しています。私の最初の簡単な試みは、必要なデータを含むDocker画像です(link)。 ただし、これは最初の手順にすぎません。この例では、データはイメージの一部であるため、イメージがコンテナに読み込まれると、データは既にそこにあります。私の次の目的は、

    -5

    1答えて

    n_estimatorsによって実行されるランダムフォレスト回帰のパフォーマンスをチェックしようとしています。 seed = np.random.seed(1962) rng = np.random.RandomState(1962) np.random.seed(1962) estimators = [pow(2,3),10,pow(2,4),pow(2,5),pow(2,6),pow

    -2

    1答えて

    ではありません私は私の結果は再現性がないのpython にランダムフォレストとAdaBoostの回帰を実行しています[私の予測が毎回同じデータとコードを使用して実行変更] seed = np.random.seed(22) rng = np.random.RandomState(1) param_grid = {'n_estimators': [10, 100, 1000]} model

    5

    3答えて

    knitrに可変キャプションを含むテーブルやグラフィックスを簡単に作成する方法があるのだろうかと思います。私が知る唯一の方法はこれです:(簡略化https://github.com/yihui/knitr-examples/blob/master/075-knit-expand.Rnwから)。しかし、出力をsrcに集めてループの後に出力するのは難しいです。なぜなら、任意のデータセットからこのような

    0

    1答えて

    私は素晴らしい(figure)何年もの(科学的な)作者のコラボレーションを要約して来た。図は下に貼り付けられています。 各垂直線は、単一の著者を指します。各垂直線の始まりは、著者が最初の共同作業者を受けた年(すなわち、彼女が活動状態になったとき、したがって共同ネットワークの一部)に対応する。著者は、昨年(つまり2010年)に参加した共同編集者の総数に応じてランク付けされます。色付けは、各著者の共同