2016-11-24 12 views
0

私はちょうど私が働いていたプロジェクトの予測を終えました。私はいくつかの視覚化のためのグラフを使用しようとしたいが、私は適切なものを見つけるのが難しい、私が持っているデータはかなり大きいです。私のコードを残して、私の結果が一番下の1列のように見える例を残す。これは唯一の列です、私はそれがどのように動作するかを最初にグラフの1列目にしたいと思います。 iveは棒グラフを使用しようとしましたが、それは一種の奇妙な、ただ一つの全体的な青いバーです。だから、どのようなグラフがこの種の情報に適しているか分かりません。テストと対象データに matplotlibグラフのデータの問題

トレーニングとテストを読ん

は列方向

電車= pd.read_csv( ':/Users/Michael/Desktop/train.csv/train.csv C' と一致しなければなりません、parse_dates = [ '日付']) テスト= pd.read_csv( 'C:/Users/Michael/Desktop/test.csv/test.csv',parse_dates = [' 日付])

# TRAINING data 
#Convert crime labels to numbers 
df_crime = preprocessing.LabelEncoder() 
crime = df_crime.fit_transform(train.Category) 
#Get binarized weekdays, districts, and hours using dummy variables 
days = pd.get_dummies(train.DayOfWeek) 
district = pd.get_dummies(train.PdDistrict) 
hour = train.Dates.dt.hour 
hour = pd.get_dummies(hour) 
#Build new array 
train_data = pd.concat([hour, days, district], axis=1) 
train_data['crime']=crime 
#train_data.head() 

#Repeat for test data 
days = pd.get_dummies(test.DayOfWeek) 
district = pd.get_dummies(test.PdDistrict) 

hour = test.Dates.dt.hour 
hour = pd.get_dummies(hour) 

test_data = pd.concat([hour, days, district], axis=1) 

features = ['Friday', 'Monday', 'Saturday', 'Sunday', 'Thursday', 'Tuesday', 
'Wednesday', 'BAYVIEW', 'CENTRAL', 'INGLESIDE', 'MISSION', 
'NORTHERN', 'PARK', 'RICHMOND', 'SOUTHERN', 'TARAVAL', 'TENDERLOIN'] 

training, testing = train_test_split(train_data, train_size=.60) 





#bernoulliNB 
# predicting only on the training data 
model_B = BernoulliNB() 
model_B.fit(training[features], training['crime']) 
predicted2 = np.array(model_B.predict_proba(testing[features])) 
log_loss(testing['crime'], predicted2) 
# predictingon the test data, using bernoulli model 
predicted3 = model_B.predict_proba(test_data[features]) 

#Write results 
result=pd.DataFrame(predicted3, columns=df_crime.classes_) 

# this is an example of 1 of my columns that i would like to graph 
    result['SUICIDE'] 
0   0.000432 
1   0.000432 
2   0.000760 
3   0.000903 
4   0.000903 
5   0.001089 
6   0.000903 
7   0.000903 
8   0.000550 
9   0.000744 
10  0.000903 
11  0.000550 
12  0.000550 
13  0.000744 
14  0.000744 
15  0.000219 
16  0.001089 
17  0.000903 
18  0.000760 
19  0.000760 
20  0.000760 
21  0.000550 
22  0.000744 
23  0.000903 
24  0.000760 
25  0.000787 
26  0.000760 
27  0.000265 
28  0.000903 
29  0.001089 

答えて

0

あなたは出力が期待されるものに関して非常に漠然としていますが、私はあなたが海底のパッケージをチェックアウトしなければならないと思います。 eチュートリアルのセクションvisualising univariate datasetsを参照してください。出力を視覚化するためにできることの例とアイディアがいくつかあります。

+0

完璧に、私が探していたもの、ありがとう – lupejuares