私はこの制約で検索エンジンをセットアップする方法を知りました:URLを参照せずに保存されたデータをユーザーが検索できるようにするにはどうすればよいですか?
ウェブサイト(交通量の少ないウェブサイト)では、ニュースコンテンツは保存されていますが、これらのコンテンツが実際にどこに表示されるかはわかりません。 URLを推測することはできません。
この機能を実現するためにどのような技術を使用する必要がありますか?
私は検索中にウェブサイト全体をクロールする検索エンジンが必要でしょうか? sphynx/lucene/solrが適切かどうか誰にでも教えてもらえますか?
私はあなたに同意していません。ページ全体をクロールする検索エンジンについてはどうでしょうか。そうすることで、URLを知ることができます。 1日に1回ウェブサイト全体をクロールするタスクを作成することで、検索データベースの更新を維持するのに役立ちます。 –
ページ全体をクロールすると、十分な情報が得られます**。あなたの制約は「URLを推測できません」* –
Johanは正しいです、ウェブページをクロールすることは、ドキュメントの参照がURLであることを意図しています... –