2011-02-03 1 views
5

私はDjangoで書かれたWebサイトの検索ソリューションを実装したいと思います。使用可能なオプション(私はSolr、Sphinx、Xapian、PostgreSQL/Tsearch3、MySQLを研究しました)から、スフィンクスは一番いいと思われます。ただし、ポーランド語のステミングはサポートされていません。これは検索可能にしたいデータの言語です。スフィンクスをポーランド語で検索しますか?

スフィンクスでサポートされていない言語を扱う最良の方法は何ですか?私は、Ispell辞書からステミングコーパスを作成できるという直感を持っています。スフィンクスとはどのように仕事をすることができますか?

答えて

0

メールマガジンhttp://snowball.tartarus.org/で検索してください。誰かがポリッシュステマーを作成しようとすると、いくつかの情報が見つかるかもしれません。 2つのフリーステムマーがありますが、それらはJavaで作成されています(少なくとも1つはsolr/lucene用に作られていると思います)。 Ispellからは、ステミングコーパスが助けになるかどうか分からないので、ワードフォームや例外に使用するファイルを作成することができます。

関連する問題