2017-05-15 5 views
1

データ、2つのカテゴリ変数、2つのバイナリターゲット変数をラベル付けしました。PMMLへのエクスポートモデル

ヘッダーなど。

column_1,column_2,column_3,column_4,target_1,target_1 

どのようにPMMLにエクスポートできますか?私が見つけた唯一の例では、教師なしデータ

import pandas 

iris_df = pandas.read_csv("Iris.csv") 

from sklearn2pmml import PMMLPipeline 
from sklearn2pmml.decoration import ContinuousDomain 
from sklearn_pandas import DataFrameMapper 
from sklearn.decomposition import PCA 
from sklearn.feature_selection import SelectKBest 
from sklearn.preprocessing import Imputer 
from sklearn.linear_model import LogisticRegression 

iris_pipeline = PMMLPipeline([ 
    ("mapper", DataFrameMapper([ 
     (["Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width"], [ContinuousDomain(), Imputer()]) 
    ])), 
    ("pca", PCA(n_components = 3)), 
    ("selector", SelectKBest(k = 2)), 
    ("classifier", LogisticRegression()) 
]) 
iris_pipeline.fit(iris_df, iris_df["Species"]) 

from sklearn2pmml import sklearn2pmml 

sklearn2pmml(iris_pipeline, "LogisticRegressionIris.pmml", with_repr = True) 

答えて

1

で提供される例では、教師classificicationについてです - Pipeline#fit(X, y)方法のy引数はラベルです。

あなたの場合は、次のようになります。

pipeline = PMMLPipeline(
    ("mapper", DataFrameMapper([ 
    (feature_column, LabelBinarizer()) for feature_column in ["column_1", "column_2", "column_3", "column_4"] 
    ])), 
    ("classifier", LogisticClassification()) 
) 
pipeline.fit(df, df["target_1"]) 
関連する問題