2016-05-24 22 views
-1

機械学習を使用してモデルを作成し、与えられた日付の登録数を予測したいと考えています。私は日付、申し込みの数、そしてこの分類子を訓練するのに役立つかもしれない他の変数/特徴を含む訓練セットを持っています。また、30日ごとにthis trendが表示されます。機械学習を使用してデータを予測する

最終的に、私はこのような何か(使ってPython)希望:私はScikitのサポートベクター分類方法を見つけた

exampledata = [({'date':'01-01-2016','day': 'friday', 'holiday': True, 'etc': 0.3}, 20), ({'date':'02-01-2016','day': 'saturday', 'holiday': False, 'etc': 0.3}, 25),({'date':'03-01-2016','day': 'sunday', 'holiday': False, 'etc': 0.4}, 40)] 
classifier.train(exampledata) 
classifier.predict("04-01-2016") 
>>> 30 

を、私は中に私のデータにフィットするかどうかはわかりません

どうすれば始めることができますか?さらに情報が必要な場合は、私に知らせてください。

+3

機械学習コースを受講することをおすすめします。 – tenwest

答えて

1

これは満足のいく回答ではないかもしれません... まず、クラシファイアのトレーニングに使用する属性のセットを選択する必要があります。学習するには、クラシファイアモデルを選択する必要があります。最終的にはトレーニングセット、テストセット、および検証セットを提供する必要があります。これらはすべて元のセットのサブセットです。多くの技法では、モデルとそのパラメータを選択して、予測学習者がすべてを学習してテストした結果、最良(または最悪)の結果が得られます。

私はscikit-learn(http://scikit-learn.org/stable/)を使用して、チュートリアル(http://scikit-learn.org/stable/tutorial/)にアクセスするのに時間がかかることをお勧めします。役に立つはずの情報がたくさんあります。どのように訓練項目やその期待される結果を与えるかは、予測モデルを学ぶ際に非常によく説明されています。

関連する問題