glm

    1

    1答えて

    私はデータセット(data_2、以下を参照)でRでglm()コマンドを使用しようとしています。私は、次のコマンドを使用します。 glm(formula = GRM_KerkMeerlo ~ ((fGS*0.865 + fQS*EC_QS + fXS*EC_fXS)/Q), data = data_2) 私は正しいことをやっていたと思ったが、私は、この入力を実行すると、私はエラーを取得:私はこの

    1

    1答えて

    glmを使用してRでロジスティック回帰を実行する際にいくつかの問題があります。バイナリ応答変数をglmに渡してロジスティック回帰を実行するには、2つの方法があります。データをシリアルデータ形式でglmに渡すことができます(例:観測ごとに1行、応答変数は0または1、独立変数にはあなたが持っている値を持ちます)、またはそれを渡すことができます最初の列は試行回数を示し、2番目の列は成功数を示し、3番目の

    0

    1答えて

    私は、次元削減のために後方選択と線形回帰を比較しようとしています。データセットはむしろ150変数で大きくなります。私はいつもこの時間はこのデータセットで選択したモデルのためのクロスバリデーションとの比較を生成するために、同じ方法を使用しますが、している 、cv.glmは私が解決する問題があるエラーを与える:モデルで エラー.frame.default(式= SurveyTest $ H.test〜

    1

    1答えて

    私はtrainSAとtestSAという名前のデータセットを使用しています。とりわけ、列番号はchd age alcohol obesity tobacco typea ldlです。 このコマンドは(私はRで働いていることに注意してください) set.seed(13234) modFit<-train(chd~ age+ alcohol+ obesity +tobacco +typea +ldl,

    2

    1答えて

    2つの問題があります。 私は以下のようにsample.splitを使用して、テストや電車のセットに私のデータを分割しようとすると、サンプリングはかなり不鮮明に行われます。私が意味するのは、データdの長さが392であるため、4:1除算では0.8 * 392 = 313.6つまり313または314行がテストセットに表示されますが、示されている長さは304です。行方不明ですか? require(caTo

    1

    1答えて

    私は二項glmモデルを構築しました。このモデルは、2つの潜在的なクラス(ADまたはControl)の間の出力を予測します。これらの変数は、{AD、Control}レベルの要因です。私はこのモデルを使って各サンプルの確率を予測していますが、0.5を超える確率がADまたはコントロールを示すかどうかは私には不明です。ここで は私のデータセットです。 > head(example) clea

    0

    2答えて

    私はRに50 lmとglmオブジェクトを持っています。summary(lm...)を50回タイプすることなく、それらのすべての要約を得たいと思います。それをすばやく行う方法はありますか?データセットの名前は、lin.mod.t#またはlin.mod.s#({#= 1,2、...、25})のように始まります。私は ls(pattern = "lin.mod") objects(pattern =

    2

    1答えて

    私は85個の予測変数のテーブルを用意しています。そのうちのいくつかは数値、論理、序数、名義(ホット1符号化)です。彼らは、私が使用して段階的にGLMを実行している0から1の範囲にある単一finalScoreアウトカムVARを予測している。 % model2 = stepwiseglm(predictors, finalScore); 各予測のヘッダは、それがある4つの種類のいずれかを示し、場合、私

    1

    1答えて

    h2oパッケージを使用して、異なる正規化パラメータ(アルファ、ラムダ)を持つGLMモデルからアンサンブルを構築しています。 [email protected]_idsはGLMに最適な alphaと lambda正則化パラメータを決定するために、グリッドサーチからモデルです ensemble <- h2o.stackedEnsemble(x = predictors, y =

    0

    1答えて

    私がやっていることがすべて正しいことを確認したいだけです! 私はいくつかのサイトで鳥の数を農地と湿地の2つの生息地に分類しています。私は単にどの生息地がより多くの個体数を持っているかを知りたいだけです。 私は(彼らは、カウントデータであるとして)ポアソン機能でGLMを使用しています: > mod <- glm(count ~ habitat, family = "poisson") > sum