Nutch 2.3.1用の簡単なプラグインをこのsiteからいくつかのガイドを使って書きました。今私はそれをテストして、それをNutchに統合する前に正しく動作していることを確かめる必要があります。私が単にjavaコマンドで実行すると、クラスにエラーが見つかりません。どうすれば私のプラグインをテストできますか?いくつかのユースケースでApache Nutchプラグインをテストする方法
答えて
あなたはIndexingFilter
プラグインを作成しましたか?私の普通のお勧めは、あなたが書いたプラグインと何らかの形で「類似」していることです。たとえば、プラグインを使って、このプラグインのテストがどのように書かれているかを調べましょう。https://github.com/apache/nutch/blob/2.x/src/plugin/index-anchor/src/test/org/apache/nutch/indexer/anchor/TestAnchorIndexingFilter.javaを見てください。あなたのプラグインが設定からいくつかの値(設定オプションのファイルへのパスなど)を読み込んだ場合は、36-39行(https://github.com/apache/nutch/blob/2.x/src/plugin/index-anchor/src/test/org/apache/nutch/indexer/anchor/TestAnchorIndexingFilter.java#L36-L39)をよく見てください。
一般的な考え方は、作成したフィルタをインスタンス化し、偽のデータをフィードし、フィルタの実行結果にアサートします。 https://wiki.apache.org/nutch/WritingPluginExample-0.9に関する情報は、Nutchの1.xブランチに固有のものですが、そこに行くのに役立つ一般的なガイドラインが含まれています。ユーザーがクロールを実行する必要なし/テスト設定値を「再生」したいとき
いくつかのプラグインは、端末から直接bin/nutch
スクリプトを使用して呼び出すことができるようにmain()
メソッドを実装し、これは便利です。 main()
メソッドを実装したら、bin/nutch plugin <plugin name> <plugin class> [some additional parameters]
コマンドを使用してプラグインを呼び出すことができます。プラグインはconf/nutch-site.xml
ファイルで有効にする必要があります。 https://github.com/apache/nutch/blob/a3e7420494304bc4de7ee1a0b25a5158108856f5/src/plugin/urlfilter-regex/src/java/org/apache/nutch/urlfilter/regex/RegexURLFilter.javaを見てください。このプラグインはNutchの1.xバージョン用に実装されていますが、私が話したことの詳細を見るのに役立ちます。
これで、1)隔離された環境で実装をテストし、2)プラグインにさまざまなオプションを持つ追加の設定ファイルがある場合は、ユーザー/テスト環境を提供します。最後に、Nutchのテストスイート全体を展開して展開してから、小さなテストクロールを実行してすべてが正常であることを確認してください。
- 1. apache nutch - REST経由でプラグインの設定を変更する方法
- 2. Apache Nutch 2.3をカスタマイズする方法
- 3. いくつかのトピックでApache nutchを使用してデータをクロールする方法は?
- 4. 新しいscoringFilterプラグインを作成するために、apache nutchの各URLのanchorTextを取得する方法は?
- 5. Nutchで深くクロールする方法
- 6. Apache Nutch 2.xでwebgraphを取得する方法
- 7. nutchプラグインの実行をログに記録する方法
- 8. org.apache.nutch.crawl.Crawlerのクラスはapache-nutch-1.12ですか?
- 9. Apache Nutch 2.3.1をサイドバーではなく記事コンテンツをクロールする方法を制限する方法
- 10. Apache Nutchでクロール中のエラー
- 11. のApache Nutchは - NoSuchMethodError
- 12. nutchプラグインでtikaを使用
- 13. Apache Nutch注入URL
- 14. ストームクローラ - テクノロジースタックとApache Nutch
- 15. いくつかのユースケースは何ですか?e in Vim?
- 16. MinitestのTCPSocketにいくつかのテストを書く方法
- 17. fastlaneプラグインのフォークをテストする方法
- 18. いくつかのjavascript APIのテストを自動化すると、一連のユースケースが得られますか?
- 19. Apache NutchとSolrの統合
- 20. Apache Nutch Web CrawlingのシードURL
- 21. ボタンクリック後にapache nutchファイルをダウンロードする
- 22. eclipseを使ってNutch 2.xプラグインを作成する
- 23. Apache Pigでいくつかの列を交差する方法は?
- 24. intellijプラグインのテスト方法
- 25. AIXマシンにApache Nutch 1.11がインストールされているbin/nutchが見つかりません:
- 26. apache nutchを使って外部リンクをクロールするのを防ぐ方法は?
- 27. TestNGテスト結果をユースケースに割り当てる方法は?
- 28. エラー:mongodbでApache nutchを起動中に
- 29. カスタムプロセッサをテストする方法 - Apacheのキャメル春のテスト
- 30. Apache Nutch再起動クロール