2011-10-26 5 views
0

アドバイスシーカーとアドバイス提供者を区別するために使用するのに良い論理は何ですか(疑問符を探す以外に)?今は、PHPで非常にシンプルなロジックを使用して、アドバイスを求める人/助産師が一般的に使用するキーワードを特定していますが、おそらく他の誰かが良いアイデアを持っています。助言がありますか?アドバイスシーカーとアドバイス提供者を区別するためのロジック

答えて

1

多分一部の機械学習方法ですか? Naive Bayesアルゴリズムは、このようなタスクではうまくいくはずです。

+0

データセットはどのように見えるでしょうか?私はキーワードのメソッドを保持し、それを入力として使うべきですか、または投稿全体を入力として使うべきですか? – Jonathan

+0

最も簡単な方法はbag-of-wordsアプローチです。つまり、単語カウントの有無にかかわらず、テキストに含まれる単語のリストをアルゴリズムに入力するだけです。このメソッドは、最初に単語カウントなしでテストし、単語カウントでテストして、分類子に許容可能な精度があるかどうかを確認できます。それが失敗すると、バイグラム、トリグラムなどを試すことができます。 一言で言えば、どのアプローチがあなたのケースに最も適しているかを最初に試す必要があります。 –

関連する問題