2016-08-05 23 views
1

私は機械学習を実験しており、多くの変数に基づいて予測を行うモデルを開発する必要があります。プログラムはmakeprediciton.csvファイル機械学習PythonのNaive Bayesクラシファイア

Outlook,Temperature,Humidity,Windy,Play 
rainy,hot,normal,TRUE, 
に予測を挿入する必要があります

train.csv

Outlook,Temperature,Humidity,Windy,Play 
overcast,hot,high,FALSE,yes 
overcast,cool,normal,TRUE,yes 
overcast,mild,high,TRUE,yes 
overcast,hot,normal,FALSE,yes 
rainy,mild,high,FALSE,yes 
rainy,cool,normal,FALSE,yes 
rainy,cool,normal,TRUE,no 
rainy,mild,normal,FALSE,yes 
rainy,mild,high,TRUE,no 
sunny,hot,high,FALSE,no 
sunny,hot,high,TRUE,no 
sunny,mild,high,FALSE,no 
sunny,cool,normal,FALSE,yes 
sunny,mild,normal,TRUE,yes 

:私はこれを説明することができます最も簡単な方法は、以下の「ゴルフをする」の例を介して行われ

私はこの分類器をExcelを使用して適用することができました。 Pythonで簡単なライブラリがあれば、周波数をグループ化して、手作業でコードを書く必要がなくなります。

以下のリンクでExcelを通して私のアプローチを見ることができます: http://www.filedropper.com/playgolf

任意の助けをいただければ幸いです。

+2

'を見てくださいを使用することができますscikit-learn'を行ってください。また、stackoverflowに関するライブラリの推奨事項について質問することも控えてください。これらの種類の質問は、スタックオーバーフローには適していないと明示的に述べられています。 – cel

答えて

1

によって異なります。コード化したくない場合は、Rapidminierを試してみてください。それは学び、実験するのがとても簡単です。それはdocumentationは非常に良いとclear.YouはNaive Bayesianの分類子のためのThis exampleを見ることができ、結果を得る。あなたには、いくつかのコーディングおよび使用のpython langは、試したい場合は


Scikit-learn魔女はPythonで、より高度なlibです。これはscipyとnumpyを利用し、データマイニングアルゴリズムの非常に強力な実装をしています。あなたの例では、まず、高次元にあなたのカテゴリ機能を変更するには、スパースベクトルをOne-Hot-Encodingを使用する必要があり、その後、CSVファイルを読み込むためにもNaive Bayesian


のような分類器を使用して、あなたはPandas

関連する問題