2012-03-27 12 views
3

私はUIMAとSolrを接続しようとしています。私はSolr 3.5 distをダウンロードし、Windows 7のnutchとtikaで正常に動作するようにしました。これはcygwin経由でsolrcellとcurlを使用しています。 まず、solr/contrib/uima/libの6つのジャーをsolrの作業/libにコピーしました。 次に、私はsolr/contrib/uima/libのreadme.txtファイルを読み込み、無駄に両方の私のsolrconfig.xmlschema.xmlをを編集しました。 私はAlchemyやOpenCalaisを使う気にしなかったので、このリンクをもう少し適用してみた。http://code.google.com/a/apache-extras.org/p/rondhuit-uima/?redir= 1 まだ、私はsolrcell経由でpdfをインポートするcurlコマンドを実行しても、追加のUIMAフィールドを取得することはできませんし、ログに何かを取得することもありません。 test.pdfというは、しかし解析され、私が使ってSolrでPDFを参照してください。基本的なUIMAとSOLR

curl 'http://localhost:8080/solr/update/extract?fmap.content=content&literal.id=doc1&commit=true' -F "[email protected]" 

SolrConfig.XML

<updateRequestProcessorChain name="uima"> 
    <processor class="org.apache.solr.uima.processor.UIMAUpdateRequestProcessorFactory"> 
    <lst name="uimaConfig"> 
     <lst name="runtimeParameters"> 
     <str name="host">http://localhost</str> 
     <str name="port">8080</str> 
     </lst> 
     <str name="analysisEngine">C:\uima\desc\com\rondhuit\uima\desc\NextAnnotatorDescriptor.xml</str> 
     <bool name="ignoreErrors">true</bool> 
     <str name="logField">id</str> 
     <lst name="analyzeFields"> 
     <bool name="merge">false</bool> 
     <arr name="fields"> 
      <str>content</str> 
     </arr> 
     </lst> 
     <lst name="fieldMappings"> 
     <lst name="type"> 
      <str name="name">com.rondhuit.uima.next.NamedEntity</str> 
      <lst name="mapping"> 
      <str name="feature">entity</str> 
      <str name="fieldNameFeature">uname</str> 
      <str name="dynamicField">*_sm</str> 
      </lst> 
     </lst> 
     </lst> 
    </lst> 
    </processor> 
    <processor class="solr.LogUpdateProcessorFactory" /> 
    <processor class="solr.RunUpdateProcessorFactory" /> 
</updateRequestProcessorChain> 

<requestHandler name="/update/uima" class="solr.XmlUpdateRequestHandler"> 
    <lst name="defaults"> 
    <str name="update.chain">uima</str> 
    </lst> 
</requestHandler> 

を、私はまた私のrequestHander ADJUSTED:

<requestHandler name="/update" class="solr.XmlUpdateRequestHandler"> 
    <lst name="defaults"> 
     <str name="update.processor">uima</str> 
    </lst> 
    </requestHandler> 

のSchema.xmlを

<!-- fields for UIMA --> 
<field name="uname" type="string" indexed="true" stored="true" multiValued="true" required="false"/> 
<dynamicField name="*_sm" type="string" indexed="true" stored="true"/> 

すべてI私がしていることをしようとしているのは、UIMAがテキストから名前を引っ張って(デモとして始める)、私が間違っていることを理解することができないということです。 これを読んでいただきありがとうございます。

+0

ありがとうjavanna、私は何か新しいことを学んだ... – Chris

+1

将来の参考として、[リンク](http://mail-archives.apache.org/mod_mbox/lucene-solr-user/201203.mbox/%3C1332899823598-3863324 .post @ n3.nabble.com%3E)をsolrメーリングリストの同じ投稿に追加します。 – javanna

+0

あなたは毎日何か新しいことを教えています、あなたはjavannaありがとう!今からやりなさい。 – Chris

答えて

1

これがこれまでに解決されたかどうかは確かではありませんが、他の誰かが見ている場合には、私はこの同じ問題を昨日持っていました。 Solrcellを使用するために私が/ update/extractを呼び出していることがわかりました。これは/ updateに統合されているため、uimaを使用していません。

関連する問題