私はSolrの検索と置換機能のようなものを探しています。Solrでの検索と置換?
私はsolrにドキュメントをダンプし、テキスト解析を行っています。時々私は単語のカップルをグループ化し、solrが1つの単一のトークンとしてそれを扱うようにする必要があるかもしれません。
例:「南アフリカ」は、後で処理するための単一のトークンとして扱われます。また、これらが動的であることに気付くと、最終的なユーザーがグループ化する単語を決定できるようになります。だからセマンティクスは必要ありません。
私の現在の計画は、これらの2つの単語の間に特殊文字を追加することです.Solrはそれを次の処理のための1つの単一のトークン(StandardTokenizerFactory)として扱います。
だから、のようなものを探しているイム:誰もがすべてのソリューションを持っていることができます
replace("South Africa",South_Africa")
?
私はあなたがトークンを「理解」するのWordNetや他の自然言語技術(品詞)が必要と思います。私は単語を理解できるフィルタに興味があります(例えば、 "ITマネージャ"と "雨が降っている"の区別)。 – aitchnyu