impala

    -1

    2答えて

    に「孤立」の行を見つける: | ID | DATE | VALUE | | ------------- |:-------------:| -----:| | 1 | '2016-08-01' | 1600 | | 9 | '2016-03-03' | 12 | | 1 | '2016-08-21' | 1 | | 4 | '2016-09-01' |

    0

    1答えて

    次のコードを使用して、スパークデータフレームをJDBC接続を介してインパラントに書き出します。 df.write.mode("append").jdbc(url="jdbc:impala://10.61.1.101:21050/test;auth=noSasl",table="t_author_classic_copy", pro) しかし、私は次のエラーを取得:ます。java.sql.SQL

    8

    1答えて

    私は複数の大きなデータツールを評価しています。そのうちの1つは当然インパラです。 クラスタノードでプロセスを手動で起動してImpalaクラスタを開始したいと考えています。私は現在Spark、H2O、Presto、Daskのためにバイナリを取得し、ノードにコピーし、configを編集し、シェルからノード上のサービスを開始したいと思います。これは非常にうまく動作します。アップグレードするのは簡単です。

    0

    1答えて

    私はHIVE 13.1を広く使用しており、Impala 2.5で私の仕事の一部を実行したいと考えています。インパラでは現在のハイブのどの機能が利用できませんか?ワークフローをHiveからImpalaに移行した人はいますか?注目すべきことは何ですか?

    0

    1答えて

    私は、Impalaのすべてのグループで「総計」列を実行する方法を探しています。 このように分割されたグループの合計を取得するために、ウィンドウ関数を使用するのは簡単です: 合計(x)は(Aによるパーティション)を超える によって分割する表現があることが表示されません。しかし、 'すべて'。これはImpalaの欠点ですか?あなたはover文を空白のままにしておくことができます。

    0

    2答えて

    でグループを使用して、私は、次の表を持っている: id | animal | timestamp | team --------------------------------------- 1 | dog | 2016-08-01 | blue 2 | cat | 2016-08-02 | blue 3 | bird | 2016-07-05 | red 4 | cow | 2

    4

    1答えて

    MySQLからテーブルをインポートしました。これはHiveに1,000万行あり、機能とパフォーマンスをチェックするためにImpalaでいくつかの操作を実行します。次のクエリを発行すると、エラーargument of type 'NoneType' is not iterableが表示されます。 これを修正するためにデータをインポートしてから何か必要なことはありますか?私は主に分析目的のためにImp

    0

    1答えて

    次の事実を考慮して、Hive/Impalaテーブルを効率的に設計するにはどうすればよいですか? 表は、 日ごとに約1億行のツールデータを受け取ります。データを受け取った日付は、ツールIDとともに の列に格納されます。 各ツールは、カラム実行IDによって識別される1日あたり約500回の実行である を受け取ります。各実行ID には、おおよそ1MBのサイズのデータ​​が含まれています。 ブロックのデフォ

    1

    1答えて

    すべての値のリストを作成することによって、フィールドを集約:チームがグループに id | animal | team ------------------------- 1 | dog | A 2 | cat | A 3 | cow | A 4 | bird | B 5 | rat | B 6 | goat | C 私が欲しい、とリストにチーム内の動物を集約。出力は次のよ