2012-06-07 11 views
5

私は各書籍がカテゴリに属する​​書籍のリストを持っていました。飛行機フライングJavaでレコードを分類する

  • - 航空
  • 画像を絵画 - アート
  • 1001レシピ - 私はデータの巨大な十分なサンプルセットを持って

を調理。私はいくつかのアルゴリズムを使用して私の新しい本を分類する必要があります。私はそれが決して100%正確ではないことを知っているが、良い推測は私のために良いです。

このようなことを行うために実装する必要はありますか?私はClassifier4Jと一緒に行くべきで、それはVector Classifierですか?

Wekaのように見える他のツールはありますか?誰かがいくつかの記事や例を私に教えてくれたら、私を始めにしてくれれば幸いです。

おかげ

+0

あなたは急速な鉱山労働者を見てみることができます:Lingpipeに含まれるデモが開始するには良い場所です。 – toniedzwiedz

+1

これを見てください:[java-text-classification-problem](http://stackoverflow.com/questions/2821575/java-text-classification-problem)、皆さんはほぼ同じことをやっています。 – 16dots

答えて

1

機械学習と呼ばれるhttps://www.coursera.org/course/mlのコースがあります。あなたが分類としてあなたの問題を見るならば、N 1対すべての分類子を訓練するべきです。Nはあなたのクラス(=カテゴリ)の数です。クラシファイアを訓練するには、自然言語処理クラスhttps://www.coursera.org/course/nlpに記載されているアルゴリズムを使用します。通常は、既存のクラスhttp://nlp.stanford.edu/IR-book/html/htmledition/text-classification-and-naive-bayes-1.htmlと似ています。このすべてはApache Mahoutでhttps://cwiki.apache.org/confluence/display/MAHOUT/Bayesianを使って行うことができます。

関連する問題