2017-12-21 43 views
-2

分類または回帰では、入力データ(トレーニングデータ)から学習するためにモデルが必要です。例のように、最良の可能なモデルパラメータ値を見つける(線形回帰で)。/Github-Aurelien Geron handson-ML-マスターから機械学習モデルのデータフィッティングと予測

このコードは次のとおりです。私は機械学習における分類部を通過している間

は、私は(MNISTデータセットに「未-5」を分類するモデル)の下に与えられたこのコードに会いました03_Classification.ipynb

以下は、モデルで相互検証を実行するためのコードです。

never_5_clf = Never5Classifier() 

cross_val_score(never_5_clf, X_train, y_train_5, cv=3, scoring="accuracy") 

まあこれは、カスタムモデルを作っているので、私は(黒い箱の中に何が起こるか)どのようにデータが装着されていることを知ってほしいです。私は多くのモデルに出くわしましたが、パラメータ値を決定するいくつかの数学的な証明/方法がありました。

+0

このコードはどこにありますか?それをリンクしてください。 –

+0

@VivekKumar完了! –

+0

never5classifierは何も学習せず、常にすべてのデータが負であると予測します。即ち5ではない。 –

答えて

0

上記の例では、データセットの特定の数字に数字5というラベルが付いているかどうかをモデルが分類しようとしています。これはtraining setにという数字だけを含むモデルを与え、training setからモデルには5のユニークな特性(features)が学習されています。この方法では、あなたのモデルは、あなたのtraining setに含まれる各画像を28x28ピクセルから学習しています。モデルのトレーニングが終了したら(5の分量のサンプルを分級機に供給すると)、モデルのテスト準備が整いました。テスト段階では、testing setを使用しています。この場合は、学習したモデルのtraining setとは異なります。それはtraining setのような数字5だけでなく、すべてのタイプの数字(0-9)を含むようになり、あなたのモデルはどちらも1の意味でtrue (別名:5)または(別名:5)である0を使用してください。これはfit()関数がこの場合に働く方法です。あなたのモデルは1桁(あなたの場合は数字5)でトレーニングしています。その後、あなたのモデルがランダムであるかどうかを調べるかどうかをテストしていますtesting setの数字は実際には5または他の数字です。 training setfit()を呼び出した後、5という数字が認識されましたが、3, 8, 4 or 1の外観はわかりませんでしたが、5でない場合はモデル以外の番号であることがわかりますまだ学んだ。