にモデルデータを保存しない:私は地元としてそれを実行すると、それがいることを/フォルダALSIndexerを生成し、私のマシンでMLlib我々はおおよそ次のようになり、機械学習モデル持っスパーク2.1
sc = SparkContext(appName = "MLModel")
sqlCtx = SQLContext(sc)
df = sqlCtx.createDataFrame(data_res_promo)
#where data_res promo comes from a pandas dataframe
indexer = StringIndexer(inputCol="Fecha_Code", outputCol="Fecha_Index")
train_indexer = indexer.fit(df)
train_indexer.save('ALSIndexer') #This saves the indexer architecture
を寄木張りとモデルに関するすべての情報があります。
SparkのAzureクラスタで実行すると、メインノード(またはスレーブ)のフォルダは生成されません。しかし、書き直すと次のようになります:
cannot overwrite folder
これは、どこかにあることを意味しますが、わかりません。
ポインタはありますか?
クラスタ上の分散ファイルシステム(hdfsまたは同等のもの)を確認しましたか? – Shaido
/home/ml/alsindexerのようなHDFSの絶対パスを指定してください。私はそれが/ user/spark /に書き込もうとしているかもしれないと仮定します。 –
@Shaidoは正しいです、それはhdfsにあります、それはちょうどコピーバックの問題でした。あなたはポイントを得るためにそれを答えて気にしますか? –