私はNaive Bayesベースの実装に取り組んでおり、モデルチューニングに関してはSpark 2.0を使用していますが、モデル、私はスパーク2のモデルパーシステンスのサポートをよく知っているが、私の懸念は、特に保存されたモデルのデータフォルダ内のナイーブなベイズのための保存されたモデルの内容にあり、依存するpiクラスの数に、我々は他の&モデルのデータフォルダの並べ替えコンテンツに実際のデータに依存し、データサイズが大きくなり、スパークナイーブベイズモデル永続性:理解してください&
ので、ナイーブベイズに設定された機能のクラス&数の数にまで依存シータ(マトリックス)であるを持っています誰でも助けてもらえますか? hが正確に格納しているものを理解しているので、私は基本的に、これらのデータを私の生産アーキテクチャーにどこに置くかについて私の決定をするために同じことが必要です。
私はこれらの上でたくさん見つけることを試みたが、ドン、tは彼らが正確に理解..彼らは次元C(あるクラスの事前分布の
- @paramのパイログとして言及されているスパークJavaのドキュメントで次元D(機能の数)
によってC(クラス数)であるクラス条件付き確率のクラスの数)
質問はまた、彼らはそう前に、この1.6で、これら二つの属性は、ナイーブベイズモデルを含む、パイ&シータ
あなたはこれに適した情報源を見つけることができましたか? – woodhead92