SparkのJoinsとLookupの議論について誰かが気づいているのですか?私はこのページを見ました:Lookup in spark dataframes誰もが基本的には、ジョインはルックアップよりはるかに優れていると言います。私はgoogle-fuの試みでそれを裏づけるものを見つけたり、2つのトピックについて議論したりしていませんでした。SparkのLookupとJoinの違い
0
A
答えて
1
Spark DataFrameのルックアップなどは存在しないため、他のソリューションや結合(ハッシュまたはブロードキャスト)より劣っているか、ローカルデータ構造を使用することが唯一の選択肢です。
0
ルックアップと結合は、リレーショナルデータシステムの2つの異なる概念です。したがって、一般的な文脈では、異なる機能を持つため、他のものよりも優れていると言うのは実際には意味をなさない。ルックアップは単にデータを見つけることであり、キーやハッシュ値を使用してクエリ速度を最適化することもあります。結合は、2つのデータセットの共通要素を使用して新しいデータセットを作成しています。
など。
検索クエリ(完全に仮想的な抽象)1
= 'こんにちは'
参加クエリ1、クエリ2
=
「こんにちは世界
の場合クエリ2はワールド
関連する問題
- 1. Apache Sparkのlookup()関数
- 2. Spark DataSetとRDDの違い
- 3. Spark mllib:implicitTrainとexplicitTrainの違い
- 4. Spark SQLとHiveの違い
- 5. JoinとSQLのUNIONの違い
- 6. 休止状態のLEFT JOINとLEFT JOIN FETCHの違いは?
- 7. 擬似ファイバ - join()とget()の違い
- 8. JoinとNatural Joinの違いは何ですか?
- 9. QuantileDiscretizerとSparkのBucketizerの違い
- 10. mavenアーティファクトspark-core_2.10とspark-core_2.11の間のスパークの違い
- 11. Spark SQL - df.repartitionとDataFrameWriterパーティションの違い?
- 12. Apache Spark SQLとMongoDBの違いは?
- 13. spark-defaults.confのspark。{driver、executor} .memoryとspark-env.shのSPARK_WORKER_MEMORYの違いは何ですか?
- 14. joinステートメントのANDとWHEREの相違点
- 15. JOINステートメントとJOINステートメントがないステートメントの違いは何ですか?
- 16. oracle sqlのjoinキーワードとinner joinキーワードの違いは何ですか?
- 17. lookupとgroupby
- 18. hdfs://とsparkの糸の相違
- 19. SparkのReduceByKeyとCombineByKeyの相違点
- 20. このWHERE句とこのJoinの違いは何ですか?
- 21. C++でのマルチスレッドのjoin()とdetach()の違いは何ですか?
- 22. PIGのCogroupとJoinの違いは何ですか?
- 23. Pythonのstr.join()とstr()。join()の違いは何ですか?
- 24. spark mllibとspark mlのベクトル実装の違いは何ですか?
- 25. Spark SQL - gzipとスナップとlzoの圧縮形式の違い
- 26. interposeとclojure.string/joinの違いは何ですか?
- 27. wait(long timeout)とjoin(long millis)の違いは?
- 28. `FROM _、_`と `FROM _ INNER JOIN _ ON _`の違いは何ですか?
- 29. Spark StandaloneとYARNとローカルモードの違いは何ですか?
- 30. キャパシティプランナーのSUMIF/LOOKUP