2016-05-30 8 views
0

Rを使用して連続応答変数の予測を実行するAzure ML実験を開発しようとしています。最初の実験は比較的簡単で、「Rモデルの作成」、「列車モデル」、「スコアモデル」などのいくつかの実験項目といくつかのデータ入力が組み込まれています。Rスコアリングスクリプトから返されるスコアはどのようなタイプですか?

私はML Studio内で実験を実行するとエラーなしで実行されるように見えるトレーニングスクリプトとスコアリングスクリプトを作成しました。しかし、スコアリングされたデータセットを調べると、スコア値はすべて欠損値になります。だから、私のスコアリングスクリプトがスコアを間違って返すことが懸念されます。誰も私が戻ってくるべきタイプをアドバイスできますか?それは単一の列data.frame、または何か他のものを意味しますか?

Rスタジオで期待通りの結果を示しているトレーニングとスコアリングスクリプトを実行していますが、スコアリングスクリプトでスコアが正しく計算されていない可能性もあります。誰かが私のスコアリングスクリプトのデバッグを何らかの方法で実行する方法を提案できれば、コードがどこで期待通りに動作しないのかを判断することができれば役に立ちます。

おかげで、ポール・

答えて

0

は、このサンプルを使用してみてくださいとあなたとの比較 - https://gallery.cortanaintelligence.com/Experiment/Compare-Sample-5-in-R-vs-Azure-ML-1

+0

はその実験で私を指してくれてありがとう。私は、Scorerスクリプトが複数列のデータフレームを返すことができると結論付けました。 あなたの実験では、set.binary.classification.scores()やset.true.label()など、文書化されていないように定義されている関数が使用されているように見えます。それは事実か、私は何か見落としたことがありますか? – Paul

+0

私はあなたのドキュメントが見逃されているかもしれない、あるいはトップレベルですぐには見えない記事の中にいるかもしれない、あなたが正しいかもしれないと思います。私はそれにフォローアップしています。知らせてくれてありがとう – neerajkh

0

私の提案は、あなたがデータ入力を行う前に、データの前処理を行うことです。欠損値と異常値をクリアします。関連するデータ前処理技術を使用して、これらの操作を実行します。

関連する問題