1

WindowsのSystemMLスタンドアロンバージョンでデシジョンツリーを実行しようとしていますが(https://github.com/apache/incubator-systemml/blob/master/scripts/algorithms/decision-tree.dml)、「NUMBER OF SAMODES AT NODE 1.0は10に減らすことはできません。このノードはリーフとして明白です! "私はRを介してツリーを実行することができますが、コードはどのような分割も計算していないようです。誰もこのアルゴリズムを以前に使っていて、エラーを解決する方法についていくつかのヒントを持っていますか? ありがとうございましたSystemMLデシジョンツリー - 「NODE 1.0のサンプル数は10に減らすことはできません」

答えて

1

このメッセージは、一般的に、最高のカテゴリまたはスケール機能の分割が追加の利益をもたらさないことを示しています。

私は計算されたゲイン(best_cat_gain、best_scale_gain)

  • メタデータ(num_cat_features、 num_scale_features)が正しく認識されていることをダブルチェックを調査

    1. に推薦します。

    追加の印刷文をスクリプトに追加するだけで、それを行うことができます。メタデータが無効な場合は、スクリプトのヘッダに記述されているように、オプションの入力Rが適切なレイアウトになっていることを確認することができます。

    これが役に立たない場合は、入力引数、入力データの形式などを共有してください。

  • +0

    ご返信いただきありがとうございます。 – Elly

    +1

    私のデータには、バイナリターゲット(0/1)と10個の変数(すべて数値)があります。私は2つの.mtxファイルを作成しました。 Y(n * 2)と呼ばれるものには、次の形式のターゲットだけが含まれます。行1がターゲット0であれば、行1がターゲット1を持つ場合、Yは最初の列(0,1)になり、行2は値(1,0)を持ちます。 他の.mtxファイルには10個の変数がありますので、それは行列です(n * 10) – Elly

    +1

    2つのメタデータも次のような形になりました "{ " data_type ":" matrix "、 " value_type " : "二重"、 "行":150000、 "colsの":2、 "NNZ":150001、 "フォーマット": "CSV"、 "ヘッダ":偽、 "9月": "" 、 "説明":{ "著者": "SystemML" は }}」私は実行 コマンドは以下の通りである runStandaloneSystemML.batスクリプト/アルゴリズム/決定tree.dml -nva rgs X = C:/Users/Documents/data/X.mtx Y = C:/Users/Documents/data/Y.mtx M = C:/Users/Documents/data/model.csv – Elly

    関連する問題