最新の "apache mahout"ライブラリの "clusterdump"にseqFileDirオプションがありますか？

mahout kmeansクラスタリングの例（synthetic_controlの例）の出力で「clusterdump」を実行しようとしています。しかし、私は次のエラーを経験しています：最新の "apache mahout"ライブラリの "clusterdump"にseqFileDirオプションがありますか？

> ~/MAHOUT/trunk/bin/mahout clusterdump --seqFileDir clusters-10-final --pointsDir clusteredPoints --output a1.txt 

MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to classpath. 
Running on hadoop, using /usr/lib/hadoop/bin/hadoop and HADOOP_CONF_DIR=/usr/lib/hadoop/conf/ 
MAHOUT-JOB: /home/<username>/MAHOUT/trunk/examples/target/mahout-examples-0.8-SNAPSHOT-job.jar 

12/06/21 22:43:18 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively 

12/06/21 22:43:25 ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options: 
usage: <command> [Generic Options] [Job-Specific Options] 
.....

をだから私はclusterdumpには「seqFileDir」オプションが存在しないと思いますが、すべてのオンラインチュートリアル（例えばhttps://cwiki.apache.org/MAHOUT/cluster-dumper.html）は、このオプションを参照してください。あなたは私に救済策や私が逃しているものを教えてもらえますか？

出典

2012-06-21 Aniruddha Basak

--inputオプションを指定しようとしましたか？

出典

2012-06-22 08:56:42

はい私はしました。 --seqFileDirを--inputに置き換えたとき、出力ファイルはでしたが、それはEMPTYでした！チュートリアルで--seqFileDirオプションについて話す理由を知っていますか？ –

私はこの問題に取り組んでいました。魔法のように私は解決策を見つけた！あなたの提案に感謝します--inputは--seqFileDirオプションのinplaceで働いていました。私が間違っていたことは、clusterdump（HADOOP_HOMEが設定されている）がHDFSから読み込み、ローカルファイルシステムに出力を書き込むことがわかりませんでした。とにかく、今はうまくいっています！ –

最新の "apache mahout"ライブラリの "clusterdump"にseqFileDirオプションがありますか？

答えて

関連する問題