2012-03-24 3 views
9

私は以下のオープンソースツールについて知っていますが、それぞれの優れた比較方法は見つかりませんでした。フレーズ抽出を使用する準備と ツール:現在どのようなフレーズ抽出ツールが最新の状態になっていますか?

  • KEA
  • MAUI(http://code.google.com/p/maui-indexer/)
  • ドラゴン、xTractます(http://ドラゴン.ischool.drexel.edu/xtract.asp)
  • Lingpipe(http://alias-i.com/lingpipe/demos/tutorial/interestingPhrases/read-me.html)
  • Mahoutの(https://でcwiki .apache.org/MAHOUT/collocations.html)
  • その他

誰もこのような比較を見たことがありますか?

+0

、あなたは「文分割」または「文章トークン化」を意味するのですか? – Renaud

答えて

0

それは

+0

マレットでフレーズを抽出する方法は?つまり、トピックモデリング=クラスタリングがありますが、大きなコーパスからキーフレーズを抽出することはできません。 – yura

+0

あなたは正しいです、申し訳ありませんが、トピックモエリング –

4

MAUI私の実験にKEAを凌駕を本当に使いやすいですコマンドラインツールを持っているので、私はMalletが好き。 教師なしの自動キーフレーズ抽出方法(Coling 2010 paper)の比較があります。しかし、彼らは監督された方法を分析しない、私は近い将来にそれを行うことを計画している。

また、私は、まだ完全ではない自動キーフレーズ抽出のパフォーマンスを向上させたより豊富な機能を検討しました。私は来年の拡張版でMAUIの拡張版をリリースするかもしれない。

次の論文を読んだり、私に詳細をメールしてください:「フレーズ抽出」と

Supervised Topical Key Phrase Extraction of News Stories using Crowdsourcing, Light Filtering and Co-reference Normalization

Keyphrase Cloud Generation of Broadcast News

関連する問題