私は、ウェブサイトをクロールするためにnutch 1.4を使用し、solr 3.5にインデックスデータを使用しました。これは成功しました。私はルークを使って索引データをチェックし、1678の文書が取り出されたことを発見しました。しかし、検索のためのsolrインターフェイスにクエリ文字列(ほんのいくつかのキーワード)を入力すると、すべての1678のドキュメントが取得されました。ほとんどの検索されたWebページにこれらのキーワードがまったく含まれていなかったので、これは奇妙です。すべてのドキュメントが検索されているsolr検索
この問題の考えですか?
ありがとうございます。
サンダー
それは何でもかまいません。詳細を追加できますか?たとえば、あなたの 'schema.xml'とあなたが試しているクエリ。ありがとう – javanna
私はクロールしたものは、医学図書館のWebサイトです。それは主に医療用語と用語を含んでいます。たとえば、クエリ文字列 'Clinical Allegy&Clinical Immunology'を入力した場合、solrはすべての1678ドキュメントを返します。ありがとう!ちなみに – thunder
は、nutch_home/runtime/local/confにあるNutch 1.4から直接コピーされた 'schema.xml'を使用しました。ありがとう! – thunder