SOLRにはCellというモジュールがあります。 Tikaを使用して文書からコンテンツを抽出し、SOLRで索引付けします。SOLR Cellはどのようにドキュメントコンテンツを追加しますか?
https://github.com/apache/lucene-solr/tree/master/solr/contrib/extractionの出典から、Cellは生の抽出されたテキスト文書テキストを「内容」というフィールドに配置すると結論づけます。フィールドはSOLRによって索引付けされますが、格納されません。ドキュメントをクエリすると、「コンテンツ」が表示されません。
私のSOLRインスタンスにはスキーマがありません(私はデフォルトのスキーマをそのまま残しました)。
デフォルトのUpdateRequestHandler
(/solr/corename/update
へのPOST)を使用して、同様の種類の動作を実装しようとしています。 POSTリクエストが行く:この方法で追加書類を
<add commitWithin="60000">
<doc>
<field name="content">lorem ipsum</field>
<field name="id">123456</field>
<field name="someotherfield_i">17</field>
</doc>
</add>
は、コンテンツフィールドはをインデックス化し、を格納しています。これはクエリの結果に表示されます。私はそれが欲しくない。それはスペースの無駄です。
Cellがドキュメントを追加する方法について私は何が分かりませんか?
私はクエリを実行しました。 'content'フィールドはそこにありますが、' stored = false'はありません。 '_text_'という別のフィールドには' stored = false'があります。しかし、私はCellソースで '_text_'への参照を見つけることができませんでした... –