1
私はApache Mahoutと協力して、適切なサイズのドキュメント(〜500k)をベクトル化してクラスタ化しています。プロジェクトのウェブサイトとMahout in Actionの両方の例での作業では、minLLR
のパラメータがseq2sparse
と数回使われていますが、どのような値が期待されているのかは分かりません。このパラメータの適切な値を見積もるための「開始地点」や方法はありますか?Apache Mahout-MinLLRパラメータを使用したドキュメントのベクトル化