基本的に私はSolrで単語またはpdf文書のインデックスを作成しようとしていて、ExtractingRequestHandlerを見つけましたが、C#でコードを書く方法を理解できません。 Solr wiki:http://wiki.apache.org/solr/ExtractingRequestHandler。C#クライアントからのSolrのPDF文書の索引
Solr zipのexample/solrディレクトリにあるファイルをTomcat 7(7.0.22)にインストールしましたが、何も変更していません。 ExtractingRequestHandlerはsolrconfig.xmlのボックスから外して設定し、すぐに使用できるようにする必要があります。
あなたは、HTTP POST要求をどのようにして作成し、Solr Wikiのcurlを使用してPDFファイルをアップロードするかについて、C#(HttpWebRequest)の例を挙げることができますか?
私はこのサイトと、これがどのように行われたかについての例やチュートリアルを見つけようとしていますが、何も見つかりませんでした。
EDIT:
私は最終的にそれがSolrNetを使用して動作するように得ることができました!
- のapache-Solrの細胞-3.4.0.jarファイルから:それはあなたがSolrのジップからあなたのSolrのインストールディレクトリ内のlibフォルダにこれをコピーする必要が動作するためには
SolrNet 0.4.0ベータ2では\ libディレクトリdistののcontrib \抽出のフォルダ
- コンテンツを
、このコードは、仕事をしていません:
Startup.Init<IndexDocument>("YOUR-SOLR-SERVICE-PATH");
var solr = ServiceLocator.Current.GetInstance<ISolrOperations<IndexDocument>>();
using (FileStream fileStream = File.OpenRead("FILE-PATH-FOR-THE-FILE-TO-BE-INDEXED"))
{
var response =
solr.Extract(
new ExtractParameters(fileStream, "doc1")
{
ExtractFormat = ExtractFormat.Text,
ExtractOnly = false
});
}
solr.Commit();
申し訳ありません。しかし、他の人にはこれが役に立つと思います。
非常に有用な情報 - >それは私のために働く。 – FrenkyB
IndexDocumentクラスを投稿できますか?ありがとう! – CmdrTallen
ExtractParametersを使用するにはSolrNet> 0.3.1( "Install-Package SolrNet-Pre")が必要です – CmdrTallen