私は自然言語モードでMySQLを使って情報検索システムを開発しています。 私が持っているデータは、さまざまなカテゴリを考慮して注釈が付けられています。例えば。猿、猫、犬は「動物」、アヒルは「鳥」として注釈されます。問題は、これらのタグの発生に基づいてドキュメントを取得していることです。全文検索のためにSphinxを使ってMySQLの関連性スコアを改善する
MySQLには、特定の用語がデータ全体で50%を超える場合、その用語は考慮されないという制限があります。私の要件を考慮して、データ全体で特定の用語が50%以上になっても一致するすべての用語にスコアを付けたいと思っています。
私は検索効率のためにSphinxとMySQLの組み合わせについていくつか読んだことがありますが、これが私の状況に適用できるかどうかはわかりません。
私はWindowsマシンにsphinxをインストールしましたが、MySQLからスフィンクスにデータをコピーする方法がわかりません。 SphinxSEを使用したいのですが、MySqlを50%使用せずに使用したいと思っています。また、SphinxSEを設定する方法を教えてもらえますか? – Pink
インデックスの作成に関する文書を確認する必要があります。それはすべてsphinx設定ファイルで行われます。私はWindows上でSphinxSEを設定する方法はわかりませんが、通常はmySQL内でSphinxSEをコンパイルします。 – Hawkee
すべてのお手伝いをありがとう!私はインストールとインデックスを把握します。私はプラグインのsphinx SEをインストールした後にもう1つ質問があります。MySQLデータベースをクエリできますが、MySQLが適用されない50%ルールがあり、取得したドキュメントの関連スコアを取得します – Pink