2011-01-26 11 views
0

私はウェブサイトをデザインすることを含むユニプロジェクトをやっています。私は開発の初期段階にあり、これまでに学んだことを理解することを明確にしたいだけです。私のウェブサイトには、パワーポイント、単語、そしておそらく他のファイルがあるデータベース(SQLまたはOracle)が含まれますが、これらは主にこれらのファイルです。初心者の助けが必要です - Lucene

私はにはLuceneを使用することができます。 1)関連するページ 2を検索し、検索するためのキーワードを使用して、私のサイトを検索)私はコアのLuceneを集め何からデータベース

から関連パワーポイント、ワードのファイルを検索し、抽出私のサイトとデータベースのインデックスを作成し、関連するページとファイルを探します。私は、クローラやユーザーインターフェイスなど他のソフトウェアを追加する必要があります。

私はこれについて初めてのことですが、最初はかなり複雑ですが、これまでに正確に集めたものは何ですか?

多くのおかげで、

フィル

答えて

1

1)あなたは、Luceneインデックスを作成する必要があります。

2)あなたのサイトをクロールするためにnutchを使用する方法の1つは、あなたのウェブサイトからのすべてのリンク/データをインデックス化するluceneインデックスを返します。

3)データベースのルーゼンインデックスも作成できると思います。

関連する問題