2017-10-24 8 views

答えて

0

手動で実行間のバリエーションを単純に滑らかにすることはできません。あなたができることは、GridSearchCVを使ってハイパーパラメータチューニングを実行することです(あるいは、at this linkなどの他の同様の方法を参照することもできます)。また、見積もりの​​パフォーマンスを向上させるためにデータセットのCross-validationを見ることもできます。私たちはより良いあなたを助けることができるようにSklearn for cross-validationに。

またなど、あなたが解決している問題のタイプのように、あなたの問題のためのデータセットをより多くの情報を提供してください。

0

VotingClassifierソフト投票であなたが何であるかかもしれ一般に、2組の予測がある場合、予測の幾何平均を取って平滑化することができます。

from scipy.stats.mstats import gmean 
df = pd.DataFrame() 
#prediction renamed in 1.csv,2.csv... for convenience 

for i in range(1,4): 
    data = pd.read_csv('{}.csv'.format(i),index_col='id') 
    data = data.rename(columns={'proba':i}) 
    df = pd.concat([df,data],axis=1) 

df['proba'] = gmean(df.iloc[:,1:4],axis=1) 
output = pd.DataFrame(data={'id':df.index,'proba':df.proba}) 
output.to_csv('submissions.csv',index=False) 
関連する問題