2017-01-13 7 views
0

私はSolrを使い慣れていませんが、SolrでSVGファイルを簡単に索引付けする方法があると思います。私はSolr 6.3.0をインストールしました。私は、例の 'ファイル'コアを使用しています。それは正常に動作しますが、SVGファイルをプレーンテキストとして解析するようです。SOLRを使用したSVGファイルのインデックス付け

テキストタグの間のテキストのみを取り出す簡単な方法はありますか?

理想的には、JSONファイルのメタデータの一部とSVGファイルのテキストを結合したいと考えています。 JSONファイルは次のようになります。

{ 
    "id":"000001", 
    "title":"Some diagram", 
    ... 
} ...

関連するSVGファイルは000001.svgです。

Solrにスキームを作成する方法はありますか?それはjsonからフィールドを取り込み、フィールドをSVGファイルのテキストとマージできますか?

+0

私はあなたがsolrにファイルを渡す前に、これらのマージすることを行う必要はないと思う...しかし、他の人が同じように応答するのを待つことができます... –

答えて

0

あなたが望むことを行う最も柔軟な方法は、JSONを解析し、S​​VGをピックアップして関連する要素を抽出し、Solrに完全な構造を送信するカスタムインデックス作成ユーティリティを書くことです。選択したプログラミング言語に応じて、SolrJ、Solrnet、または他のクライアントライブラリのようなものでこれを行います。

これはSolrに直接統合するよりも柔軟でメンテナンスが容易ですが、追加のJSONを使用せずにカスタムSVGインデックスを作成する場合は、通常の更新ハンドラでXSLT supportを使用するか、an XPathEntityProcessorをDataImportHandlerの構成。

私の選択はカスタムインデックス作成コードです。

関連する問題