Bingの検索ヒットはかなり印象的です。マイクロソフトでは、検索技術の舞台裏で誰かに手を差し伸べることはできませんか? http://www.discoverbing.comを試しましたが、私の質問に対する答えが見つかりませんでした。ビングの背後にある技術は何ですか? map-reduceアルゴリズムの独自のバージョンまたは何か他のもの?
9
A
答えて
8
マイクロソフトは歴史的に、ランキング機能としてニューラルネットワークランキング機能を使用しています。ニューラルネットワークは、URLがランキングに関連する数百の変数を組み合わせています。 Paper詳細ランカーを使用して、通常は100 dpi以上のスコアを出します。各クエリノードは、トップレベルのドキュメントを孤立してスコアリングし、アグリゲータに返す必要があります。実際にはランキングは非常に複雑でスコアリングアルゴリズムは一般に多レベルです。
コンピューティングジョブ、要因生成など... Microsoft Searchではを使用していますが、これはDryadの上に構築されていますが、DryadLINQは使用しません。 SCOPEは、基本的にクラスタの上にあるSQL言語です。
実際、マイクロソフトはGoogleよりも検索技術がはるかにオープンです。 Microsoft Research AsiaとMicrosoft Research Silicon Valley
0
これは中古の情報ですが、逆数のインデックス(インデックス?)を使用してトップ100の検索結果を得たことを理解しています。その後、ニューラルネットワークを使用してトップ10に数回絞り込みます、トップ3を探して、最初のものを探します。
これは、最初のヒットが検索エンジンが動作するかどうかをユーザーに判断させる理由によるものです。あなたがCNNを検索し、最初のヒットとしてCNN.comを取得しない場合、ユーザーはエンジンが動作しないと思う。
また、これは間接的な知識です。私は検索チームでMSにしばらく働いていた友人からこれを聞いた。
関連する問題
- 1. AdventureWorksインストーラの背後にある技術は何ですか?
- 2. ドラッグ可能なオブジェクトの背後にある技術は何ですか?
- 3. Math.pow()の背後にあるJavaのアルゴリズムは何ですか
- 4. linuxのfactorコマンドの背後にあるアルゴリズムは何ですか?
- 5. cinemagraphの背後にある技術
- 6. カラーホイールの背後にあるアルゴリズムとは何ですか?
- 7. ST_LineMerge()の背後にあるアルゴリズムは何ですか?
- 8. ウェブアプリケーションプロジェクトに最も関連するサーバープッシュ技術は何ですか?
- 9. Javaミドルウェア技術とは何ですか?
- 10. JavaのArrayListのadd()メソッドの背後にあるアルゴリズムは何ですか?
- 11. iPhone SDKのフレームアニメーション技術による最も簡単なフレームは何ですか?
- 12. scikit-learnのextract_patches関数の背後にある理論/アルゴリズムは何ですか?
- 13. ブロガータイプのテキストエディタで使用される技術は何ですか?
- 14. 技術的にs3n、s3aとs3の違いは何ですか?
- 15. AJAXウェブアプリケーションのユーザビリティの技術的限界は何ですか?
- 16. Robot()の背後にある技術的、根本的な理由は何ですか?createScreenCapture()はとても遅いですか?
- 17. PowerShellでは、技術的には「ヘルプ」コマンドとは何ですか?
- 18. PUTとPOSTの技術的な違いは何ですか?
- 19. ejbの中核技術は何ですか?
- 20. 最新のDeBayer/Demosaicing技術は何ですか
- 21. C++:技術レベル(ASM)のR値参照とは何ですか?
- 22. Windows Azure REST Apiの技術とは何ですか?
- 23. "スマート"インストーラの技術用語は何ですか?
- 24. Technoratiが構築した言語/技術/フレームワークは何ですか?
- 25. 「初期WSDL」とは技術的には何ですか?
- 26. 技術的にはムーンライトとは何ですか?
- 27. 独立して動作するコードの一部を切り離すPerlの技術とは何ですか?
- 28. (-m)パラメータのtarの背後にある謎は何ですか?
- 29. このコードの背後にあるトリックは何ですか?
- 30. Javaのオブジェクトクラスの背後にあるメカニズムは何ですか?
map reduceは実際には「検索」アルゴリズムの一部ではありません。問題を並列部品に分解する方法です。彼らはおそらく同様のものを使用していると言っています。 –
は、Googleの文書を検索するアルゴリズムではなく、ページランク(結果のGoogle品質のバックボーン)はこのアルゴリズムを使用するため、検索に関連しています。 –