set-intersection

    2

    1答えて

    私が取り組んでいるアプリケーションでは、10〜1,000,000アイテム程度の大規模なセット交差を行う必要があります。私たちが交差しているアイテムは単にObjectIdです。 たとえばボックス文書があり、ボックス文書の中にitem_ids配列があります。各ボックスのこのitem_ids配列には、10〜1,000,000個のObjectIdが格納されます。 ここで最終目標は、ObjectId 4d3

    5

    1答えて

    hadoopユーザーのメーリングリストとここでクロスポストして申し訳ありませんが、これは私にとって緊急の問題です。次のように 私の問題は、次のとおりです。 私は2つの入力ファイルを持っている、と私は決定したい A)のみ)1 Bファイルの行数を発生する行数います :専用ファイル2 C)の両方(例えば、文字列等価に関して)で 例と共通線の数で発生各ケース210 File 1: a b c F