impala

-1熱

2答えて

に「孤立」の行を見つける： | ID | DATE | VALUE | | ------------- |:-------------:| -----:| | 1 | '2016-08-01' | 1600 | | 9 | '2016-03-03' | 12 | | 1 | '2016-08-21' | 1 | | 4 | '2016-09-01' |

0熱

1答えて

インパラデータベースにスパークデータフレームを書き込む方法

次のコードを使用して、スパークデータフレームをJDBC接続を介してインパラントに書き出します。 df.write.mode("append").jdbc(url="jdbc:impala://10.61.1.101:21050/test;auth=noSasl",table="t_author_classic_copy", pro) しかし、私は次のエラーを取得：ます。java.sql.SQL

8熱

1答えて

移植可能なバイナリからimpalaクラスタを実行しています

私は複数の大きなデータツールを評価しています。そのうちの1つは当然インパラです。クラスタノードでプロセスを手動で起動してImpalaクラスタを開始したいと考えています。私は現在Spark、H2O、Presto、Daskのためにバイナリを取得し、ノードにコピーし、configを編集し、シェルからノード上のサービスを開始したいと思います。これは非常にうまく動作します。アップグレードするのは簡単です。

0熱

1答えて

ハイブはimpalaにはない機能はありますか？ Hive vs Impala

私はHIVE 13.1を広く使用しており、Impala 2.5で私の仕事の一部を実行したいと考えています。インパラでは現在のハイブのどの機能が利用できませんか？ワークフローをHiveからImpalaに移行した人はいますか？注目すべきことは何ですか？

0熱

1答えて

窓関数を使用するImpalaの総計列

私は、Impalaのすべてのグループで「総計」列を実行する方法を探しています。このように分割されたグループの合計を取得するために、ウィンドウ関数を使用するのは簡単です：合計（x）は（Aによるパーティション）を超えるによって分割する表現があることが表示されません。しかし、 'すべて'。これはImpalaの欠点ですか？あなたはover文を空白のままにしておくことができます。

0熱

2答えて

インパラ：基準に選択フィールド

でグループを使用して、私は、次の表を持っている： id | animal | timestamp | team --------------------------------------- 1 | dog | 2016-08-01 | blue 2 | cat | 2016-08-02 | blue 3 | bird | 2016-07-05 | red 4 | cow | 2

4熱

1答えて

Impala：タイプ 'NoneType'の引数が反復不可能

MySQLからテーブルをインポートしました。これはHiveに1,000万行あり、機能とパフォーマンスをチェックするためにImpalaでいくつかの操作を実行します。次のクエリを発行すると、エラーargument of type 'NoneType' is not iterableが表示されます。これを修正するためにデータをインポートしてから何か必要なことはありますか？私は主に分析目的のためにImp

0熱

1答えて

Hadoopパーティショニング。 Hive/Impalaテーブルを効率的にデザインするにはどうすればよいですか？

次の事実を考慮して、Hive/Impalaテーブルを効率的に設計するにはどうすればよいですか？表は、日ごとに約1億行のツールデータを受け取ります。データを受け取った日付は、ツールIDとともにの列に格納されます。各ツールは、カラム実行IDによって識別される1日あたり約500回の実行であるを受け取ります。各実行ID には、おおよそ1MBのサイズのデータが含まれています。ブロックのデフォ

1熱

1答えて

インパラ/ SQL：GROUP BY - 私は下の表を持っている

すべての値のリストを作成することによって、フィールドを集約：チームがグループに id | animal | team ------------------------- 1 | dog | A 2 | cat | A 3 | cow | A 4 | bird | B 5 | rat | B 6 | goat | C 私が欲しい、とリストにチーム内の動物を集約。出力は次のよ