2016-03-21 8 views
1

私はワトソン/錬金術センチメント分析APIを使用しています。これは、記事が良いまたは有益な減少を議論しているときに発生します。ワトソン/錬金術センチメント分析で、ネガティブとしてラベル付けされている場合があります。

たとえば、this Washington Post articleは、「米国では銃の暴力が大幅に減少しました。ここには理由があります。」 APIに提出すると、記事はかなり楽観的ですが、スコアは-0.4を返します。 (記事では、銃の暴力が顕著に減少していると主張している)

もう1つの例はthis article from CoreLogicで、「CoreLogicは2016年1月に38000件の差し押さえを完了しました」このAPIは、文章が肯定的であっても、文書感情スコアが-0.27を返す。「差し押さえ在庫は21.7%減少し、2015年1月と比較して差し押さえが16.2%減少した。全国的な差し押さえの完了件数は、 2015年1月の46,000件から2016年1月の38,000件になります。

この問題に対処するための確立された回避策はありますか?具体的には、サービスの信頼性を損なうものではなく、したがって、慎重な読者がAPIの示唆とはまったく異なる記事のセンチメントを評価する場合の結果を損なうことはありません。私は、特定のケース(例えば、「差し押さえの減少」は「殺人の減少」のようにプラス)で感情の結果を修正できるようなものを探しています。

答えて

1

私はこれがまったく普通だと信じています:-)これは非常にまれな感情分析アルゴリズムで、結果の100%で正しい答えを与えることができます:-)私はアルゴリズムの実装を認識していませんが、感情は表現や言葉の「センチメント」から計算されます。例えば、おそらく「銃」「暴力」はおそらく否定的な感情に関連していると思われますが、ワトソンは「大規模な衰退」(「衰退」でさえ否定的な感情を持つかもしれない)に関連していることを理解できませんでした。

芸術の精神分析アルゴリズムでさえ、非常に特定の領域について約85〜90%の精度に到達することができます。それに基づいて期待を設定することは常に重要です。

+0

レオが正しいです。錬金術が失敗した例を分類するために、データからフレーズを抽出し、[自然言語分類器](http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/nl-classifier.html)を訓練することをお勧めします正しいクラス(正または負)に変換します。その後、このモデルを錬金術出力の第2パスとして使用することができます。 –

+0

あなたの入力人に感謝します。あなたのアプローチであるジェイムズを使用して、NLCを練習して、感情が不適切なスコアのテキストタイプにフラグを立て、手動でスコアを逆転させます。 – jdscott

関連する問題