solr 6.6.0でいくつかのhtmlドキュメントのインデックスを作成します。コンテンツフィールドには多くのリンクテキストがあり、検索結果が薄くなります。だから、「コンテンツ」のタグコンテンツを削除するにはどうすればよいですか?ソルでのインデックス作成/保存のためのフィールドですか? updateRequestProcessorChainについての方法はありますか?誰もが解決策を知っていますか?どのように取り除く<a>コンテンツフィールドのタグコンテンツをインデックス化する前に/ Solrに保存
0
A
答えて
0
私は隠されたdivの前とテキストの後に追加することで問題を解決します:
<updateRequestProcessorChain name="myregex">
<processor class="solr.RegexReplaceProcessorFactory">
<str name="fieldName">mytextfield</str>
<str name="pattern">([1]{1}%{2}[A]{1})(.*)([1]{1}%{2}[E]{1})</str>
<str name="replacement"> </str>
<bool name="literalReplacement">true</bool>
</processor>
</updateRequestProcessorChain>
これは問題なく機能します。
0
インデックス時にフィールド定義でHTMLStripCharFilterFactory
をフィルタとして使用します。
<div style="display:hidden">1%%A</div>
TEXT TEXT TEXT
<div style="display:hidden">1%%E</div>
とsolrconfig.xmlに追加:入力ストリームから
このシャアフィルターストリップHTMLは
<analyzer>
<charFilter class="solr.HTMLStripCharFilterFactory"/>
<tokenizer ...>
[...]
</analyzer>
関連する問題
- 1. どのようにインデックスを作成するカタンダルに存在するタイタングラフsolrに
- 2. どのようにナビゲーションコントローラとそれ以前のコントローラにセグを取り除く?
- 3. どのようにsolrインデックスにあるのですか?
- 4. を取り除くためにどのようにメッセージ
- 5. 空のコンテンツフィールドを与えるSolr ExtractingRequestHandler
- 6. どのようにヘキサのURLの "カテゴリ"を取り除く
- 7. Solrなしコンテンツフィールド=ハイライトなし
- 8. データベースに保存されているダブル\キャラクタ(\\)を取り除くにはどうすればいいですか?
- 9. LaTex - どのように赤いボックスを取り除く?
- 10. どのようにワードプレスでロゴを取り除く?
- 11. Solrの</p> <p>で各オブジェクトのフィールドの数を返すためにどのようにSOLR
- 12. 配列インデックスの個々の値を親インデックスに保存するにはどうすればよいですか?
- 13. インデックスにSolrの
- 14. は、ブートストラップタブページに二つのバーを取り除くためにどのように
- 15. cssでborder-bottomを取り除く方法は? CSSで<strong>テスト</strong>テキストに<strong>李</strong>ときにマウスホバーで<strong>テスト</strong>テキストの下にいるのborder-bottomを取り除くためにどのように
- 16. MyBatisの - どのようにマッピングファイルを取り除くと、ちょうど注釈
- 17. Angularjsと先頭、どのように取り除く[オブジェクトオブジェクト]
- 18. サブ要素に空の名前空間 "xmlns =" ""を取り除くにはどうすればよいですか?
- 19. phpmailerのparseAddresses - 「通知」のメッセージを取り除くためにどのように
- 20. クエリによるSolrインデックスの更新
- 21. Solrによるインデックスのエラー表示
- 22. データベースに保存する前にジェネレータIDを取得するにはどうすればよいですか?
- 23. ポリモーフィックオブジェクトが保存される前にその親をどのように取得しますか?
- 24. GWT:どのようにPDFを保存/開くウィンドウを生成するには?
- 25. DBに保存する前にマスクを削除する
- 26. Excel VBAによる保存前のチェック
- 27. どのようにこれらの警告を取り除くのですか?
- 28. どのようにコードを書く方法TextView、どのようにSDカードを保存する
- 29. どのようにAndroidのメモリに配列を保存する
- 30. は、どのように私は、文字と前のスペースを取り除くための方法を取り除くパラメータを使用し、それ
HTMLStripCharFilterFactoryは、間のコンテンツではなくタグのみを取り除きます。しかし、すべてのナビゲーションリンクテキストを削除する必要があります。 – dan