OpenCV 3.1を使用しています。イメージのバッチに対してSIFT記述子を計算しました。 各ディスクリプタは、形状が(x, 128)
で、私はpickleベースのディスク.tofile
を使って各ディスクリプタをディスクに書き込みました。画像のサンプルではxは2000から3000の間ですSIFT記述子をApache Spark kmeansでクラスタリングするにはどうすればいいですか(ピクルスかどうかで)
私はApache Sparkのkmeansをpyspark経由でクラスタリングしたいと考えていますが、私の質問は2部です。
- 記述子データを転送するための最良の方法を酸洗さ
- は、どのように私は、クラスタ準備データセットにピクルスファイルの束から入手できますか、どのような落とし穴私は(スパーク、酸洗、SIFT)を認識しておく必要があり
私の関心は、シーケンスは、ディスクリプタの生成コードと
私は火花がRDDを永続化するために始めることができます? – mobcdi
@Michael Sparkは、陳述を遅れて評価します。その結果、アクション*が発生したときにのみ、*変換*ではなく、実際の作業が行われます。その答えは、いいえです。 BTW素敵な質問、私は誇りを持って私のupvoteを持っていた! :)あなたは[kmeans](http://stackoverflow.com/questions/39260820/is-sparks-kmeans-broken)について知っていれば私は本当にここでいくつかの助けを必要とするでしょう... – gsamaras