2017-11-01 21 views
-1

私はランダムな森林分類器を作成するには、このチュートリアルに従うことをしようとしています:のpython scikit-学ぶ:私の実装のための虹彩データセットを変更

https://chrisalbon.com/machine-learning/random_forest_classifier_example_scikit.html

私は、虹彩データセットの構造を維持したいと思います( iris = load_iris()がロードされています)、値と列名を変更して、iris.dataではなく自分のデータに基づいて分類します。これを行うには

私はprint("Iris: " + str(iris))をした、そして、私はそこに行くと、必要に応じて、それを修正することができるように、代わりにiris = load_iris()のそれと割り当てられたiris =(非常に長いオブジェクト)の出力をコピーしました。

私がこのプログラムを実行すると、私はこれをエラーにします。どのように解決するのでしょうか?

C:\Users\Thomas\Anaconda3\python.exe C:/Users/Thomas/Desktop/!UFV/CIS480/project/NHLPredictor-RandomForests.py 
Traceback (most recent call last): 
    File "C:/Users/Thomas/Desktop/!UFV/CIS480/project/NHLPredictor-RandomForests.py", line 171, in <module> 
    [ 5.9, 3. , 5.1, 1.8]]), 'target': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
TypeError: array() argument 1 must be a unicode character, not list 

Process finished with exit code 1 

答えて

1

代替方法を提案する可能性がありますか?

iris = load_iris() 

df = pd.DataFrame(iris.data, columns=iris.feature_names) 

これは、データフレームにアイリスデータを保存します。このデータフレームをCSVファイルに出力することができます。

df.to_csv('mydata.csv', header = True, index = False) 

これは、あなたがそれのデータにどのような変更を加えることができ、その中のデータを(あなたが一種のMS Excelや任意のスプレッドシートプログラムで開くことができます)csvファイルを作成するにCTRL + Sを打ちますそれを保存。これで、必要に応じてデータを変更しました。あなたは今できるのです。あなたはCTRL + Sは、バックデータフレームdfに今打ったときmydata.csvに格納されていたものは何でもあなたの変更

df = pd.read_csv('mydata.csv') 

チュートリアルのようにdfで何でもやり直すことができます。希望は意味をなさない!

関連する問題