2012-01-16 7 views
4

私は特別な要件を持つカスタムnutchプラグインを構築することに熱心に取り組んでいます。nutchプラグインの実行をログに記録する方法

私のプラグインはhadoop.logに記載されていますが、関連性はありませんでした。

私は私のコードの別の場所でLOG.debug("test")LOG.info("test2")を追加し、私は私の質問があるlog4j.properties

# Logging for development 
log4j.logger.org.apache.nutch.parse.html=DEBUG 

に書いた:どこ私はこれらのメッセージを見つけることができ、私はhadoop.logをチェックしましたが、私は何かを見つけることができませんでした?

Javaコードをログ/トレースするにはどうすればよいですか? (私は、Eclipseを使用していない。)あなたのプラグインは、変数クラス

public static final Log LOG = LogFactory.getLog(YourClass.class 
     .getName()); 

を持っており、あなたと呼ばれる方法があり

答えて

0

場合

ありがとう:

LOG.info("Your Logmessage"); 

そして、あなたが構築しているあなたnouchがフェッチ/クロール中にプラグインを使用するように設定されていれば、メッセージはhadoop.logに記録されます。

Nutchをビルドしたとき、プラグインを構築しているとは言えますか?

はい、あなたはNutchHome /ランタイム/ローカル/ confに/ Nutchの-site.xmlのに配備され、あなたのプラグインの設定を、確認することができます場合は、次のプラグインがランタイム環境で構成されている場合は

<property> 
<name>plugin.includes</name> 
<value>protocol-http|urlfilter-regex|parse-(html)|yourplugin</value> 
<description>The plugins which are used in every crawl ordered by call- order</description> 
</property> 

。設定ファイルを変更しない場合はNutchを再構築してください。それが助けにならないなら、あなたは私にいくつかの情報をもっと与えることができます。

+0

私はあなたの指示に従って、LOG変数を追加し、別の場所にメッセージを入れて、私はNutchのがmypluginを構築して見ることができ、私がしようと、正しくNutchの-site.xmlのを構成しました再度クロールして、hodoop.logをランタイムフォルダにチェックしてください。私のメッセージは見つかりません!私はHtmlParseFilterを実装しています...あなたはどんな種類の情報が必要ですか?おかげで –

+0

こんにちは、どのような種類のプラグインを作成したいですか?パーサー、IndexingFilter? Nutchが提供する特別なインターフェースを継承しなければならず、プラグインのplugin.xmlにそれらを正しく設定する必要があります。プラグイン構造(パッケージ)とplugin.xmlファイルを投稿する必要があります。 Greetings jp – jpee

+0

私はクラスからHtmlParseFilterを実装していますので、このメソッドを追加しました。パブリックParseResultフィルタ(コンテンツコンテンツ、ParseResult parseResult、HTMLMetaTagsメタタグ、 DocumentFragment doc){LOG.info( "フィルタメソッド内"); return parseResult;} hadoop.logにMypluginの名前があるので、plugin.xmlに問題はないと思っています。 –

1
このコードによって解決

import org.slf4j.Logger; 
import org.slf4j.LoggerFactory; 
public static final Logger LOG = LoggerFactory.getLogger("org.apache.nutch.parse.html"); 
+0

シードリスト(URL)はこの形式にする必要があります。/www .site.com/'www'を書くのを忘れないでください –

関連する問題