2017-12-20 21 views
1

私はメタタグ魔女Nutchからいくつかのメタダを索引付けしようとしています。私はステップバイステップチュートリアルNutch - Parse Metatagsをステップアップしましたが、何も索引付けされていません。Nutch index-metadata not indexing

ステップバイステップのチュートリアルのようにプラグインを設定しました。私がクロールプロセスを実行すると、15個の文書がログに索引付けされていることがわかりますが、私が弾力性を見ると見ることはできません。索引は作成されますが、索引は0です。ログにエラーはありません。

インデクサ:索引付けされたドキュメントの数、削除、またはスキップ:

インデクサ15がインデックス(/更新を追加)

インデクサは:、2017年12月20日12時42分58秒で終了経過:0時00分04秒私は、インデックス・メタデータプラグインを削除して、文書が弾性でwritedされているクロール・プロセスを再実行しますが、彼らはメタタグを持っていない場合

NutchとElasticでメタタグをクロールするにはどうすればよいですか?そのプラグインを有効にすると何がインデックスに登録されるのですか?

私は伸縮性のあるapache-nutch-1.13を使用しています。

答えて

0

解決策が見つかりました。 Elasticはフィールド名のためにエラーを投げていました。プラグインが作成した名前は「メタデータ。*」でした。 Elasticはフィールド名のポイントを受け入れません。これを解決するには、接頭辞 "metedata"なしでインデックスメタデータを設定する必要があります。このプレフィックスは、Solrの場合のみです。

<property> 
    <name>metatags.names</name> 
    <value>description,keywords</value> 
    <description>...</description> 
</property> 
... 
<property> 
    <name>index.parse.md</name> 
    <value>description,keywords</value> 
    <description>...</description> 
</property>