2016-10-24 6 views
0

インポートしたばかりのPDFドキュメントのRetrieve and Rankサービスで検索することは可能でしょうか?例:4つのPDF文書の情報を検索したいので、システムで文書をインポートし、検索エンジンを使用して情報を検索します。インポートしたばかりのドキュメントが少ない検索エンジン

実現可能性についてのご意見はありますか?

答えて

0

これは動作します - 最小要件はありません。

しかし、賢明なアイデアかどうかを知るためには、ユースケースについてもう少し詳しく知る必要があります。

たとえば、ドキュメントはどれくらいの期間ですか? R & Rが提供する最小のプロダクションクラスターは32GBなので、4枚の小さな文書を入れても月額料金を支払うことになります。これは、あなたの特定の問題を解決するための費用対効果の高い方法ではないかもしれません。

クエリに応じて何を返すのですか?それがすべてのドキュメントであれば、すべてのクエリは同じ4つのドキュメントを毎回異なる順序で返すことになります。これは非常に有益なものではないようです。

+0

私のユースケースは、ドキュメントのグループ内の情報を検索するためのものです。たとえば、5つのドキュメントをアップロードし、自然言語で質問し、最も関連性の高い情報を返します。 – Peter

+0

これは、非常に幅広いユースケースに対応しています。私は助けたいと思っていますが、上記のような詳細が必要です。 ドキュメントの詳細 - どのくらいの時間がかかっているか、どのような書式であるか、どの言語で書かれているかなど、画像、表、グラフなどが含まれます。 さらに詳しい内容 - どのような種類の質問あなたは期待している? 文書全体を返信するか、その一部などを表示するかなど、必要な回答の詳細が表示されます。 – dalelane

+0

文書テキストで、5〜30ページ以上の間、文書によって異なります。書式はPDF、doc、docxです。言語は私の場合はフランス語であり、ついにはテキストのサブセット、引用された結果だけが必要です。例:私はこれらの文書で「サムが2012年に住んでいた場所」について知りたいことについて自然言語で質問します。それは答えの引用を返します。私は私の質問がもっと説明されることを望む。 – Peter

関連する問題