2016-09-20 3 views
3

私はこのプロジェクトを使用しています:https://github.com/lucidworks/hadoop-solr 処理中の文書の名前(またはパス)がどの値に保存されているか分かりません。この値をSolr Adminに取得したい(スキーマにその名前のフィールドを追加する)。これは可能ですか?"Hadoop-Solr Lucidworks Project"は入力名のパスを取得します

例:クエリの結果が同じになるドキュメントの名前を確認できます。

私は、このコマンドを使用してプロジェクトを実行しています:

CSVIngestMapperについては
hadoop jar solr-hadoop-job-2.2.5.jar 
    com.lucidworks.hadoop.ingest.IngestJob 
    -Dlww.commit.on.close=true -DcsvDelimiter= 
    -cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1 
    - i /usr/local/hadoop/input 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 
    -s http://127.0.1.1:8983/solr 

答えて

2

これが私の仕事:

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob 
    -Dlww.commit.on.close=true 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+" 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss 
    -cls com.lucidworks.hadoop.ingest.RegexIngestMapper 
    -c collection1 -i /path/* -s http://127.0.1.1:8983/solr 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 

はまた、より多くの情報のためthisを参照してください。

1

ファイルパスが現在すべてのSolrのフィールドに追加されていません。

気軽にレポに問題を作成してください。 https://github.com/lucidworks/hadoop-solr

またPRSは

EDIT歓迎されている:(解決のためhttps://github.com/lucidworks/hadoop-solr/issues/16を参照してください)

+0

結果が属する文書の名前やパスを取得する方法はありますか?私は2 txtドキュメントを使用している場合どのような結果からtxtを知っているはずです。他のIngest Mapperでも利用できますか? @acesar –

+1

>他のIngest Mapperでも利用できますか? はい、RegexIngestMapper/GrokIngestMapperはpathというフィールドを追加します。しかし、私があなたのユースケースに従っているかどうかはわかりません。 – acesar

+0

私のコレクションに "data_driven_schema_configs"を使用しています。フィールドは、data_driven_schema_configs権限の 'managed-schema'の内側に追加する必要がありますか? @acesar –

関連する問題