2017-01-11 10 views
2

Nutch hadoopの新機能です。私はHadoop 2.7.3を、Nutch 1.12はSolr 6.3と正常に統合しました。 EclipseやIntelliJなどのIDEを使用して、カスタマイズされたクロールとデータ検索アプリケーションを開発するにはどうすればよいですか。 (私はIntellij IDEAを好む)?Nutch Hadoop Development with Eclipse/IntilliJ IDEA

私はスパークとハープの開発で初級レベルのスキルを持っていますが、この段階では、ハッチでナッチとソルに行く方法を固執しました。

+0

困っていることを指定できますか?単純なクロールとインデックス作成は、Nutchのチュートリアルに従って行うことができます:https://wiki.apache.org/nutch/NutchTutorial ところで、Nutch 1.12はSolr 6.Xをサポートしていません。私のように予期しない問題に遭遇するかもしれません:http://stackoverflow.com/questions/40354313/apache-nutch-1-12-with-apache-solr-6-2-1-give-an-error/40460928# 40460928 Nutch 1.12とSolr 5.Xを統合することをお勧めします – btaek

+0

Nutch 1.12にはバグがあります。バグを修正する方法を説明しました:http://stackoverflow.com/questions/40354313/apache-nutch-1-12-with-apache-solr-6-2-1-give-an-error/40460928#40460928 – btaek

答えて

0

Eclipse IDEを使用してNutchプラグインを開発することができます。 Eclipseにsubclipse、IvyDE、m2eプラグインをインストールし、Nutch Trunkプロジェクトをインポートする必要があります。 this blog articleで私は詳細を説明しました。プラグインの開発はnext articleです。