2011-12-20 13 views
0

私はの特定のドメインにテキストファイルのセットを持っています。私はいくつかの基準に基づいてファイルをランク付けする必要があります。テキストファイルのランク付けのメトリクス

私のテキストファイル(頻度、サイズ、使用頻度など)のランク付けに使用できるいくつかの指標で私を助けてください。私は、テキストマイニング技術を使用して、これらのテクニックの1つに基づいてファイルをランク付けしたいと考えています。

+1

達成しようとしていることは何ですか? –

+0

あなたがやろうとしていることをよりよく説明し、それぞれのエラーや質問で既に行ったコードを貼り付けてください。 – Pabluez

+0

私は特定のドメイン上に一連のファイルを持っており、異なるメトリクス/基本に基づいてランク付けする必要があります。私はランク付けすることができるさまざまな指標に基づいて考える必要があります。そして、私はさまざまな指標のために外見に入っています – siddharth

答えて

0

私が遭遇した主な問題は、関連性やその他の基準に基づいてドキュメントをランク付けすることです。

今、私は、内容(関連性)に基づいてランク付けされたドキュメントがより良い結果をもたらすとの結論に達しました。

私は、クエリに指定された検索ワードに基づいてドキュメントをランク付けするためのベクトルベースの手法を利用しています。私はそれが最良のアプローチであるかどうかは確かではありませんが、平均精度の結果を提供します

+0

私はまだあなたの質問から達成しようとしていることは確かではありませんが、私はあなたの答えからより良い意味を得ます。これは参考になるかもしれませんが、多少異なる質問(多分)への答えですが、おそらく助けになるでしょうか? http://stackoverflow.com/a/2278780/321143 –

関連する問題