2017-03-04 36 views
-1

tmパッケージを使用して文書のコーパスを作成しています。テキスト分類にスペクトルクラスタリング(kernlabパッケージ)を使用します。R:テキスト分類のためのスペクトルクラスタリング

だから、私はコーパス

my_corpus = VCorpus(DirSource(directory="C:/Users/me/Desktop/Documents", pattern="txt")

を持っていると私は、私のように置けばいいのどのような

specc(x, centers, kernel)

次の引数を取るspecc機能を使用して、スペクトルクラスタリングを実行する場合最初の議論?ドキュメントでは、xは "クラスタ化されるデータの行列、または適合するモデルの象徴的な記述、またはクラスkernelMatrixのカーネル行列、または文字ベクトルのリスト"でなければならないと述べています。しかし、単にmy_corpusを入力しても機能しません。だから私はあなたが文書のコーパスを持っている場合、これがどのように機能するのか混乱しています。

答えて

0
  1. 計算カーネル行列に

  2. スペクトラルクラスタリングを適切なカーネルを選択してください

  3. は、評価、評価、評価します。クラスタリングは失敗する可能性がありますが、結果は生成されます。また、テキスト上では、どのような結果も見栄えが良いと解釈することができます。タイトルモデリングに関する2つの出版物を参照してください。

+0

私の質問は、文書のコーパスです。 – vdvaxel

+0

どちらの方法でも簡単です。任意の2つの文書にK(i、j)が必要です。行列に格納してください。 –

+0

K(i、j)とはどういう意味ですか? )?しかし、行列をカーネル行列に変換する標準関数はありますか? – vdvaxel

関連する問題