私はNutch 1.12をElastic Searchで使用していますので、フィールドを動的にNutchDocument
に追加したいと思います。NutchDocumentにフィールドを動的に追加します
現在、静的なフィールド値をNutchDocument
に追加し、それを弾性検索にインデックスすることができます。私はNutchDocument
を、解析後に作成されていることを考える
public class CustomIndexFilter implements IndexingFilter {
private Configuration conf;
public Configuration getConf() {
return conf;
}
public void setConf(Configuration conf) {
this.conf = conf;
}
@Override
public NutchDocument filter(NutchDocument doc, Parse parse, Text url, CrawlDatum datum, Inlinks inlinks) {
String content = parse.getText();
doc.add("pageLength", content.length());
return doc;
}
}
:
は、ここに私のインデックスフィルタのコードスニペットです。ですからフィールド値はその前に供給する必要があります(私はこれをどこに供給すべきか分かりません)。これの回避策を模索しています。
あなたはIndexingFiltersによって変更、分かったとして任意の助けが理解されるであろう:)