anti-join

    1

    3答えて

    アイテムのコレクション(100万以上)があり、それを処理するシステムがあります。各プロセッサは各アイテムを一度だけ処理する必要があり、プロセッサには階層があります。 私たちの現在の実装では、各プロセッサが既に何をしたかを追跡する「処理された」テーブルを持つことです。 CREATE TABLE items (id NUMBER PRIMARY KEY, ...) CREATE TABLE item

    1

    3答えて

    のテーブルBooksがあります。プロパティはキーと値として保存されます。書籍であれば ので:書籍ID 1が0可用性を持っているので 1 LOTR 3 Harry Potter 2 : 1 LOTR 2 Harry Potter 1 3 Harry Potter 2 とプロパティが id book_id key value 1 1 available 0 2 2 availa

    1

    1答えて

    これは奇妙なパズルです。私はgutenbergr - Alice in WonderlandとUlyssesの2つのテキストをダウンロードしました。 stop_wordsはAliceから消えますが、まだUlyssesにあります。 anti_joinを フィルタ(!word%%stop_words $ word)に置き換えても、この問題は解決されませんでした。 ユリシーズからstop_wordsを取

    0

    2答えて

    私はあるテーブルからユーザの登録日を選択するクエリを持っています。 SELECT DATE(registered) FROM users WHERE user_id= ".$currentUser." ORDER BY registered ASC LIMIT 1 Iは、ユーザが会員IDが一定値以下であり、アクセス日時は、第2のテーブル(「アクセス」)には存在しないことを確認するために

    0

    1答えて

    HiveテーブルからデルタをKafkaに公開しようとしています。問題のテーブルは、単一パーティション、244 MBの単一ブロックファイルです。私たちのクラスタは256Mのブロックサイズに設定されているので、ここでは1つのファイルの最大値に達しています。 テーブルが更新されるたびに、コピーがアーカイブされ、デルタプロセスが実行されます。 以下の関数では、異なるジョインを分離して内部ジョインが許容範囲

    0

    4答えて

    何百万回も実行したことがありますが、それは機能していません。 私は履歴書に送られた人々のためのテーブルを持っており、それはそれで自分のメールアドレスを持っている... 私はこれらの人々のいずれかがウェブサイトにサインアップしていないかどうかを確認します。 aspnet_Membershipテーブルには、Webサイトに登録されているすべての人がいます。 求職者は一意で、9472人あります。 sele

    0

    1答えて

    共通のID列を持つデータフレームは最大30個あります。各dfには他の列がありますが、ここにIDを表示しています。 Library DF1 DF2 DF3 ID# ID# ID# .... 1111 1111 1112 .... 2222 1111 3333 .... 3333 3333 3333 .... 4444 2222 4444