2017-04-24 12 views
0

LinuxサーバーでR v3.3.2とH2O V3.10.2.1を使用しています。H2O MOJO(Model Object、Optimized):[columns]と[domains]の関連付け

h2o.download_mojoでモデルをMOJOに保存しました。この結果のファイルは.zipファイルです。別のありmodel.iniファイルで

[columns] 
name 
address01 
address02 
city 
state 
zip 
phone number 
age 

:私のモデルを訓練するために使用される列をリストセクション[columns]があるmodel.iniファイルで

model.ini 
domains/d000.txt 
domains/d001.txt 
domains/d002.txt 
domains/d003.txt 
domains/d004.txt 
domains/d005.txt 
domains/d006.txt 
domains/d007.txt 
domains/d008.txt 

:.zipファイルでは、これらのテキストファイルですセクション[domains]は、最終モデルで保持されているカテゴリの列のトレーニング中に使用されたデータを含むファイル名をリストします。

[domains] 
1: 71 d000.txt 
2: 71 d001.txt 
3: 51 d002.txt 
4: 3243 d003.txt 
5: 3228 d004.txt 
6: 2954 d005.txt 
7: 2456 d006.txt 
9: 616 d007.txt 

[columns]に記載されている列名を、[domains]にリストされているドメインファイルと関連付けるにはどうすればよいですか?

たとえば、最初のドメインファイルd000.txtはにはnameと記載されている最初の列のデータを含むではありません。実際には、d000.txtに3列目のデータが含まれます。address02

は、どのように私はこのマッピングを知ることができます。

1: 71 d000.txt --> address02 
2: 71 d001.txt --> phone number 
3: 51 d002.txt --> column 23 
4: 3243 d003.txt --> column 58 

Aは、POJO(プレーン古いJavaオブジェクト)をダウンロードし、この関連付けを行うのに十分な情報が含まれていました。ダウンロードしたMOJOでこれを行う方法はありません。 [domains]セクションの4列目のような

何かが参考になる:任意の助け

[domains] 
1: 71 d000.txt "address02" 
2: 71 d001.txt "phone number" 
3: 51 d002.txt "column 23" 
4: 3243 d003.txt "column 58" 

ありがとう!

答えて

1

[domains]には、属している列のインデックスが0から始まります。次の例では、「7:」はCAPSULE列を指します。これは、d000.txtファイルに2要素のドメインがリストされています。

[columns] 
AGE 
RACE 
DPROS 
DCAPS 
PSA 
VOL 
GLEASON 
CAPSULE 

[domains] 
7: 2 d000.txt 
+0

ありがとうございます!私の間違いは、ナンバリングが0ベースであることを認識していなかった。 – BA88

関連する問題