C＃クライアントからのSolrのPDF文書の索引

基本的に私はSolrで単語またはpdf文書のインデックスを作成しようとしていて、ExtractingRequestHandlerを見つけましたが、C＃でコードを書く方法を理解できません。 Solr wiki：http://wiki.apache.org/solr/ExtractingRequestHandler。C＃クライアントからのSolrのPDF文書の索引

Solr zipのexample/solrディレクトリにあるファイルをTomcat 7（7.0.22）にインストールしましたが、何も変更していません。 ExtractingRequestHandlerはsolrconfig.xmlのボックスから外して設定し、すぐに使用できるようにする必要があります。

あなたは、HTTP POST要求をどのようにして作成し、Solr Wikiのcurlを使用してPDFファイルをアップロードするかについて、C＃（HttpWebRequest）の例を挙げることができますか？

私はこのサイトと、これがどのように行われたかについての例やチュートリアルを見つけようとしていますが、何も見つかりませんでした。

EDIT：

私は最終的にそれがSolrNetを使用して動作するように得ることができました！

のapache-Solrの細胞-3.4.0.jarファイルから：それはあなたがSolrのジップからあなたのSolrのインストールディレクトリ内のlibフォルダにこれをコピーする必要が動作するためには

SolrNet 0.4.0ベータ2では\ libディレクトリdistののcontrib \抽出のフォルダ
コンテンツを

、このコードは、仕事をしていません：

Startup.Init<IndexDocument>("YOUR-SOLR-SERVICE-PATH"); 
var solr = ServiceLocator.Current.GetInstance<ISolrOperations<IndexDocument>>(); 

using (FileStream fileStream = File.OpenRead("FILE-PATH-FOR-THE-FILE-TO-BE-INDEXED")) 
{ 
    var response = 
     solr.Extract(
      new ExtractParameters(fileStream, "doc1") 
      { 
       ExtractFormat = ExtractFormat.Text, 
       ExtractOnly = false 
      }); 
} 

solr.Commit();

申し訳ありません。しかし、他の人にはこれが役に立つと思います。

出典

2012-01-19 jonasm

非常に有用な情報 - >それは私のために働く。 – FrenkyB

IndexDocumentクラスを投稿できますか？ありがとう！ – CmdrTallen

ExtractParametersを使用するにはSolrNet> 0.3.1（ "Install-Package SolrNet-Pre"）が必要です – CmdrTallen

SolrNetクライアントの使用をお勧めします。これは、ExtractingRequestHandlerをサポートしています。

出典

2012-01-20 00:19:50

私はSolrNetを既に使用していますが、ExtractingRequestHandlerがサポートされているかどうかはわかりません。これに関するドキュメントがありますか？ – jonasm

私はSolrNetのドキュメントを読んできました。最新のベータ版でしかサポートされていないようです。可能であれば、HttpWebRequestを使用するだけの例がまだ好きです。 – jonasm

これをサポートするSolrNetのバージョンはベータ版ですが、完全に安定して使用できます。私はSolrNetを2年以上使用しており、本番環境でベータリリースを問題なく実行しています。たとえばSolrNetのソース（https://github.com/mausch/solrnet）を調べるには、Solrを呼び出すためにHttpWebRequestを実行していることがわかっているので、それが何をしているかを追うことができるはずです。 –

C＃クライアントからのSolrのPDF文書の索引

答えて

関連する問題