私はこのプロジェクトを使用しています:https://github.com/lucidworks/hadoop-solr 処理中の文書の名前(またはパス)がどの値に保存されているか分かりません。この値をSolr Adminに取得したい(スキーマにその名前のフィールドを追加する)。これは可能ですか?"Hadoop-Solr Lucidworks Project"は入力名のパスを取得します
例:クエリの結果が同じになるドキュメントの名前を確認できます。
私は、このコマンドを使用してプロジェクトを実行しています:
CSVIngestMapper
については
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr
結果が属する文書の名前やパスを取得する方法はありますか?私は2 txtドキュメントを使用している場合どのような結果からtxtを知っているはずです。他のIngest Mapperでも利用できますか? @acesar –
>他のIngest Mapperでも利用できますか? はい、RegexIngestMapper/GrokIngestMapperはpathというフィールドを追加します。しかし、私があなたのユースケースに従っているかどうかはわかりません。 – acesar
私のコレクションに "data_driven_schema_configs"を使用しています。フィールドは、data_driven_schema_configs権限の 'managed-schema'の内側に追加する必要がありますか? @acesar –