私は特別な要件を持つカスタムnutchプラグインを構築することに熱心に取り組んでいます。nutchプラグインの実行をログに記録する方法
私のプラグインはhadoop.log
に記載されていますが、関連性はありませんでした。
私は私のコードの別の場所でLOG.debug("test")
とLOG.info("test2")
を追加し、私は私の質問があるlog4j.properties
# Logging for development
log4j.logger.org.apache.nutch.parse.html=DEBUG
に書いた:どこ私はこれらのメッセージを見つけることができ、私はhadoop.log
をチェックしましたが、私は何かを見つけることができませんでした?
Javaコードをログ/トレースするにはどうすればよいですか? (私は、Eclipseを使用していない。)あなたのプラグインは、変数クラス
public static final Log LOG = LogFactory.getLog(YourClass.class
.getName());
を持っており、あなたと呼ばれる方法があり
私はあなたの指示に従って、LOG変数を追加し、別の場所にメッセージを入れて、私はNutchのがmypluginを構築して見ることができ、私がしようと、正しくNutchの-site.xmlのを構成しました再度クロールして、hodoop.logをランタイムフォルダにチェックしてください。私のメッセージは見つかりません!私はHtmlParseFilterを実装しています...あなたはどんな種類の情報が必要ですか?おかげで –
こんにちは、どのような種類のプラグインを作成したいですか?パーサー、IndexingFilter? Nutchが提供する特別なインターフェースを継承しなければならず、プラグインのplugin.xmlにそれらを正しく設定する必要があります。プラグイン構造(パッケージ)とplugin.xmlファイルを投稿する必要があります。 Greetings jp – jpee
私はクラスからHtmlParseFilterを実装していますので、このメソッドを追加しました。パブリックParseResultフィルタ(コンテンツコンテンツ、ParseResult parseResult、HTMLMetaTagsメタタグ、 DocumentFragment doc){LOG.info( "フィルタメソッド内"); return parseResult;} hadoop.logにMypluginの名前があるので、plugin.xmlに問題はないと思っています。 –