2011-06-26 2 views
1

こんにちは私はSolrに来ると素朴なユーザーです。次のハードルに私を導いてください。Solr PDF文書を索引してリモートサーバーに投稿する

1)SolrのインデックスPDF文書

ソリューションは、私は、テキストファイルへの入力PDFファイルからコンテンツを抽出するためティカアプリの0.9.jarを使用

を試してみました。今私はJavaコードを書いて、Solrに文書を索引付けしようとしています。

2)私は中央のリモートサーバに文書またはインデックスのいずれかを掲示する必要があり、リモート・サーバに

を投稿してください。 curlコマンドをこれに使用できますか?

よろしくお願いいたします。 Balaji。

答えて

2

1)Solr Index PDFドキュメント - 私はSolrがこれを行うと信じています。 You can use Solr's http interfaceまたはSolrJ。 2)インデックスをリモートサーバーに投稿する - Solr replicationが請求書に適合するかもしれません。

0

PDFがWebサーバー上にあると仮定すると、Nutchを使用してそれらをフェッチして解析し、そのHTTPインタフェースを使用してインデックスをSolrにプッシュできます。

関連する問題