2017-11-09 2 views
0

のSolrバージョン:: 6.6.1のApache Solrの:どのようにアクセスするとインデックスファイル、別のサーバから

私は、Apache Solrのに新しいですし、現在はPDFファイルで検索するには、この技術を使用する方法を模索。

https://lucene.apache.org/solr/guide/6_6/uploading-structured-data-store-data-with-the-data-import-handler.html#the-tikaentityprocessor

私は、以下の例に示すように、PDFファイルが同じサーバー内のPDFファイルのための「BinFileDataSource」を使用してインデックスにできています。

今、別のサーバーの下にあるフォルダを指すbaseDirを変更する方法があるかどうかを知りたいと思います。

別のサーバーからPDFファイルにアクセスする例を提案してください。どのようにしてパスをbaseDir属性に書きますか?

<dataConfig> 
    <dataSource type="BinFileDataSource"/> <!--Local filesystem--> 
    <document> 
    <entity name="K2FileEntity" processor="FileListEntityProcessor" dataSource="null" 
      recursive = "true" 
      baseDir="C:/solr-6.6.1/server/solr/core_K2_Depot/Depot" fileName=".*pdf" rootEntity="false"> 

      <field column="file" name="id"/> 
      <field column="fileLastModified" name="lastmodified" /> 

       <entity name="pdf" processor="TikaEntityProcessor" onError="skip" 
         url="${K2FileEntity.fileAbsolutePath}" format="text"> 

       <field column="title" name="title" meta="true"/> 
       <field column="dc:format" name="format" meta="true"/> 
       <field column="text" name="text"/> 

       </entity> 
    </entity> 
    </document> 
</dataConfig> 

答えて

1

最後に、solr-userメーリングリストの回答が見つかりました。

ちょうど別のサーバー上に存在したフォルダ(SMBパスが直接動作します)にBASEDIRを変更します。

baseDir="\\CLDServer2\RemoteK2Depot" 
関連する問題