2012-01-19 3 views
8

基本的に私はSolrで単語またはpdf文書のインデックスを作成しようとしていて、ExtractingRequestHandlerを見つけましたが、C#でコードを書く方法を理解できません。 Solr wiki:http://wiki.apache.org/solr/ExtractingRequestHandlerC#クライアントからのSolrのPDF文書の索引

Solr zipのexample/solrディレクトリにあるファイルをTomcat 7(7.0.22)にインストールしましたが、何も変更していません。 ExtractingRequestHandlerはsolrconfig.xmlのボックスから外して設定し、すぐに使用できるようにする必要があります。

あなたは、HTTP POST要求をどのようにして作成し、Solr Wikiのcurlを使用してPDFファイルをアップロードするかについて、C#(HttpWebRequest)の例を挙げることができますか?

私はこのサイトと、これがどのように行われたかについての例やチュートリアルを見つけようとしていますが、何も見つかりませんでした。

EDIT:

私は最終的にそれがSolrNetを使用して動作するように得ることができました!

  • のapache-Solrの細胞-3.4.0.jarファイルから:それはあなたがSolrのジップからあなたのSolrのインストールディレクトリ内のlibフォルダにこれをコピーする必要が動作するためには

    SolrNet 0.4.0ベータ2では\ libディレクトリdistののcontrib \抽出のフォルダ

  • コンテンツを

、このコードは、仕事をしていません:

Startup.Init<IndexDocument>("YOUR-SOLR-SERVICE-PATH"); 
var solr = ServiceLocator.Current.GetInstance<ISolrOperations<IndexDocument>>(); 

using (FileStream fileStream = File.OpenRead("FILE-PATH-FOR-THE-FILE-TO-BE-INDEXED")) 
{ 
    var response = 
     solr.Extract(
      new ExtractParameters(fileStream, "doc1") 
      { 
       ExtractFormat = ExtractFormat.Text, 
       ExtractOnly = false 
      }); 
} 

solr.Commit(); 

申し訳ありません。しかし、他の人にはこれが役に立つと思います。

+0

非常に有用な情報 - >それは私のために働く。 – FrenkyB

+0

IndexDocumentクラスを投稿できますか?ありがとう! – CmdrTallen

+0

ExtractParametersを使用するにはSolrNet> 0.3.1( "Install-Package SolrNet-Pre")が必要です – CmdrTallen

答えて

3

SolrNetクライアントの使用をお勧めします。これは、ExtractingRequestHandlerをサポートしています。

+0

私はSolrNetを既に使用していますが、ExtractingRequestHandlerがサポートされているかどうかはわかりません。これに関するドキュメントがありますか? – jonasm

+0

私はSolrNetのドキュメントを読んできました。最新のベータ版でしかサポートされていないようです。可能であれば、HttpWebRequestを使用するだけの例がまだ好きです。 – jonasm

+0

これをサポートするSolrNetのバージョンはベータ版ですが、完全に安定して使用できます。私はSolrNetを2年以上使用しており、本番環境でベータリリースを問題なく実行しています。たとえばSolrNetのソース(https://github.com/mausch/solrnet)を調べるには、Solrを呼び出すためにHttpWebRequestを実行していることがわかっているので、それが何をしているかを追うことができるはずです。 –

関連する問題