2012-01-06 19 views
0

私はjavaでtextrankを実装しましたが、かなり遅いようです。誰もが期待されるパフォーマンスについて知っていますか?TextRank実行時間

それは遅くなることが予想ていない場合は、次のいずれかが問題になる可能性がある:

1)エッジを作成し、でそれに重みを追加する方法があったようにそれはいないようでしたJGraphTの時と同じので、私は体重を計算し、それが> 0なら、私はエッジを追加します。後でウェイトを再計算して、エッジをループしながらそれらを追加します。それはひどい考えですか?

2)私はJGraphTを使用しています。それは遅いライブラリーですか?

3)もっと速くするためにできることは何ですか?

+1

「かなり遅い」と評価してください。 –

答えて

1

「かなり遅い」とはどういう意味ですか。グーグルのビットは、この段落を発見:

「我々は、抄録がFiのレから読み取ったの直後の、500件の抄録のInspecの試験セットからキーワードを抽出する(100iterationsにわたる平均として)RAKEとTextRankの合計時間を算出しレイクの6倍以上の1002ミリ秒のキーワードをTextRankが抽出しました。

だからこのことから、私はまともなTextRank実装が〜1secondで〜500件の抄録からキーワードを抽出することが可能であることを推測

(コンテキストのhttp://www.scribd.com/doc/51398390/11/Evaluating-ef%EF%AC%81ciencyを参照してください。)。