1
私は自分のデータのトレーニングとテストにsklearnライブラリを使用しています。SGDClassifier with predict_proba
targetDataCsv = pd.read_csv("target.csv","rt"))
testNormalizedCsv = csv.reader(open("testdf_new.csv","rt",encoding="utf-8"))
traningNormalizedCsv = pd.read_csv("traindf_new.csv", skiprows=1,nrows=99999)
df = pd.read_csv("testdf_new.csv", skiprows=1, nrows=9999)
私のトレーニングデータには200000を超える行があるので、SGDClassifierのpartial_fitメソッドを使いたいと思っていました。
X = traningNormalizedCsv.values
y = targetDataCsv.values
clf = SGDClassifier()
clf.partial_fit(X, y)
しかし、この分類器には、テストデータのターゲット確率を得るためのpredict_probaメソッドがありません。
clf.predict_proba(df.values)
お勧めします。