2016-09-29 7 views
2

bin/crawlスクリプトでカスタムオプションを指定しようとしていて、問題が発生しました。私は私のクロールコマンドで外部アウトリンクを無視するのNutchでカスタム設定を与えたように: -Nutchクロールスクリプトのカスタムオプションが機能しない

ビン/クロール-i -D elastic.index =テスト-D db.ignore.external.links =真のURL/CrawlTest/3

しかし、これは機能しません。次に、このプロパティをnutch-site.xmlに設定して、それが動作しています。

次にbin/crawlのjavaオプションとしてnutch-site.xmlに与えられているもの以外の特定の弾性インデックスにデータをインデックスするカスタム設定を設定しようとしました。私の驚きには、それは働いています。 私が使用したコマンド: -

ビン/クロール-i -D elastic.index =テストのURL/CrawlTest/3

だから私は私の最初のコマンドはdidnの理由を知っていただきたいと思います」私は何かを欠いていますか?助けてください。

答えて

2

私は答えmyselvesを得ました。 hadoopはそれを引数として検出しないため、最初のコマンドは機能しませんでした。それはナッチ設定から読み込まれるべきです。

関連する問題