これらのコードは何を意味していますか?機械学習udacity
あなたは私に説明することができます:機械学習開発で
features_train, labels_train, features_test, labels_test = makeTerrainData()
def submitAccuracy():
return acc
これらのコードは何を意味していますか?機械学習udacity
あなたは私に説明することができます:機械学習開発で
features_train, labels_train, features_test, labels_test = makeTerrainData()
def submitAccuracy():
return acc
を追加検証セット電車/テスト・セットに、可能ならば、あなたの利用可能なデータを分割したいです。これを行うと、過度の適合をテストし、モデルが目に見えないように一般化できることを確認します。最終的な検証セットは、知らないとユーザーがテストパーティションの精度でパラメータを最適化しようとすることが多く、基本的にはそのデータのモデルにヒントを与えるため、有用なことがよくあります。検証セットは、これが発生しておらず、モデルが過密でないことをテストするのに便利です。
train_featuresは列車パーティション内でモデルを開発するために使用されている実際のデータに対応している可能性が高いです。ラベルは、予測しようとしているカテゴリです。
テストパーティションは、使用可能なデータのランダムなサンプルです。機能/ラベルは上記と同じです。
トレーニングデータからモデルを作成し、テストパーティションの精度を評価したいとします。
Sebastian Rasckaは、Pythonでの機械学習のすばらしい概要を提供します。コードサンプルといくつかの説明はhttps://github.com/rasbt/python-machine-learning-book/tree/master/code
にあります。