私は抽出プラグインを使用しています。 https://github.com/BayanGroup/nutch-custom-search 私はgithubの手順に従います。ここ は私の設定です: 1)extractors.xml タイトル」/> ナンバリングで指定しないでください
2) nutch-site.xml
<property>
<name>plugin.includes</name>
<value>protocol-http|urlfilter-regex|parse-(text|html|metatags|msexcel|msword|mspowerpoint|pdf)|extractor|scoring-opic|index-(basic|anchor|more|metadata)|query-(basic|site|url|lang)|urlnormalizer-(pass|regex|basic)</value>
</property>
3) added field in schema.xml of solr and nutch <field name="aakashtitle" type="string" stored="true" indexed="true" multiValued="true"/>
4)I added plugin in parse-plugins.xml
I am not getting any error but my data is not indexing in solr??
please help . and thanks!
1)extractors.xml <フィールド名= "aakashtitle" マルチ= "TRUE" /> <文書URL = "+" エンジン= "CSS"> <抽出物の分野= "aakashtitle"> のタイトル" /> –