2012-04-08 6 views
0

オーチャードのルートの下にあるワード内のワードドキュメントの内容を検索するために、オーチャードのlucene.netを設定する方法はありますか?それに別のウェブサイトのインデックスを作成する方法もあります。ワードドキュメント内および他のウェブサイト内で検索

+0

Lucene.Net * *コンテンツ解析ツールキット*も* Webクローラーでもありません。テキストを*何とか*取得し、Lucene.Netを使用して索引付けします –

答えて

0

オーチャードのコンテンツアイテムとして何らかの形でコンテンツを追加できる場合はContentHandlerOnIndexingメソッドでトリックを使用できます。

このような何かがそれを実行する必要があります。

public class WordDocumentContentHandler: ContentHandler { 
    public WordDocumentContentHandler() { 
     OnIndexing<ContentPart>((context, part) => { 
      // Detect if the part has the field containing the URL to the document 
      // and analyze it here. 
     }); 
    } 
} 
関連する問題