私は、Apache Solrのを始めるためにしようとしている入門、しかし、いくつかのものは私には明確ではありません。 tutorialを読んで、実行中のSolrインスタンスを設定しました。私が紛らわしいのは、Solr(スキーマなど)のすべての設定がXML形式であるということです。サンプルデータを追加すると、xmlドキュメントを追加する方法が表示されます(java -jar post.jar solr.xml monitor.xml
)。それは単にサンプルフォーマットの悪い選択ですか?つまり、ドキュメントを記述したデータをアップロードしているのですか、追加する実際のドキュメントは.xmlファイルですか?は、Solrの
私は.txt形式でいくつかの本を追加しようとしているので、私はjava -jar post.jar mydoc.txt
を使用している場合、私はそれを追加するのですか?どのように私はそれについては、この文書とメタデータ(作者、タイトル)を追加することができますか?私は、ファイルを投稿しようとすると
<html>
<head></head>
<body>
<form action="http://localhost:8983/solr/update?commit=true" enctype="multipart/form-data" method="post">
<input type="file">
<input type="submit" value="Send">
</form>
</body>
</html>
は、私はこの応答を得る:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">26</int>
</lst>
</response>
です私はSolrのにドキュメントを投稿する単純なHTMLページを設定しようとした、と述べた
これは正しい?ファイルを正常に追加したことを意味しますか?そうであれば、ファイル内の単語の1つ、たとえば "montagna"(これはイタリア語の本で、montagnaは山を意味します...)。私は、URL
http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on
を訪問した場合、私は返される何か(多分全体のテキスト、またはファイルに関するいくつかの情報を)期待していますが、これは私が得るものです:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">montagna</str>
<str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>
は見えません私とのマッチのように。また、to this answerによれば、私はhl.fragsize
で一致を囲むテキストを取り戻すことができるはずです。これを検索文字列にどのように組み込むのですか?あなたは