2017-08-14 14 views
0

紺碧のBLOBの内容を索引付けできる紺色検索の代替手段はありますか? (主にオフィスベースの文書)?Azure検索BLOBのインデックス作成の代替手段

ほとんど使用されない全文検索を公開するアプリケーションがあります。 Azureの検索は、documentdbなどに最適です。基本的な層はこの使用法をカバーしています。その場合は一日数回を検索することができるの塊にインデックスを適用するとき

はしかし、その後、コストがスタックに使用される他の機能に比べて非常に高いです。

我々はまた、ストレージの2ギガバイトの制限を打つが、文書の制限の20%未満てきました。理想的にはストレージを増やしたいと思っていますが、これはS1にアップデートするだけでストレージのコストを3倍にすることはできません。これまでのSolrのVMのを実行しているか、おそらくまだVMのようSolrには、この場合には良いだろうが必要になり、私たち自身の能力を構築している見つけ

代替。

このスケーリングの問題は、コストに関しては他の人に当たっているようですが、通常はQPSのためです。私たちのQPSは、24時間以内に数回の検索で非常に低いです。

::これをAzureに保存することをお勧めします。 AWS CloudSearchの請求は

答えて

1

私はAzureの検索エンジニアリングチームの午前私たちのユースケースでうまく動作するようです。申し訳ありませんが、価格はあなたのために働いていません。あなたが言及したように、Azureで独自のSOLRまたはElasticSearch実装を実行することは確かに選択肢ですが、あなたがAzure Searchを探している理由の1つは、あなたの検索管理をあなたのソリューションに追加するつもりはないからです。

あなたが(たとえば、あなたは、単にこのコンテンツを完全にテキスト検索を行っているか、などなどファセット、フィルタリング、としてより多くのをやっている)を行うために探しているものを具体的に知ることなしに特定のオプションに入るのは難しいです。私は1つのオプションを捨てさせてください。

コンテンツサイズを小さくすることはできますか?たとえば、本当にAzure Searchにすべてのコンテンツを含める必要がありますか、探している用語が含まれているドキュメントを識別できるように、このコンテンツの主要な用語やフレーズを索引付けするだけでいいですか?単語やフレーズを抽出するのに最適なテクノロジー(Word2Vecなど)が数多くあります。

これらの用語は、ファセットやフィルタリングにも使用でき、必要に応じて他のストアからすべてのコンテンツをロードすることができます。

用語抽出の欠点には、重要と思われる用語は含まれていない場合があります。

は、他の多くのオプションがありますが、私はあなたがする探しているものについての詳細を理解していれば多分私はより多くのを助けることができます。

リアム