impala

0熱

1答えて

ハイブロード：以下のコマンドを使用して、外部サーバーまたはリモートマシンからハイブテーブルにデータをロードします。通常、この文はhadoopローカルエッジノードから動作します。のデータのロードローカルINPATHのローカルファイルシステムは 'テーブルに上書き hive_table

1熱

1答えて

インパラ接続エラー

私はClouderaのクラスタ impala-shell -i connect 10.223.121.11:21000 -d prod_db -f /home/cloudera/views/a.hql に以下のインパラコマンドを実行しようとしていますが、私は Error, could not parse arguments "10.223.121.11:21000" としてエラーを取得する

1熱

1答えて

HBaseからデータを抽出する最も速い方法は何ですか

HBaseの30の異なるテーブルに約5TBのデータが分散されています。私の使用例は、各テーブルのYEARである2つの特定の列に基づいており、国ごとに5Kの異なるテキストファイルを作成する必要があります。私はこの目的でHIVEとHBaseを統合しましたが、HIVEからの抽出には非常に時間がかかります。私は10時間以内にこれを終わらせなければなりません。これを達成するためのアイデアを探してくだ

1熱

1答えて

エッジノードを持つHadoopクラスタを実行しているときにImpalaに接続する方法

Cloudera Managerを使用してHadoopクラスタをインストールし、現在Impalaデーモンがすべてのデータノードで実行されています。クラスタはゲートウェイ/エッジノードの背後にあり、エッジノードにはゲートウェイサービスのみがインストールされます（たとえば、httpfs、ハイブゲートウェイ、スパークゲートウェイ、oozie）。すべてのインパラデーモンがクラスタのデータノード上で実行さ

1熱

2答えて

（インパラ）AnalysisException：サブクエリが選択リストでサポートされていません

このようなクエリがあり、明らかにImpalaはSELECT文でサブクエリをサポートしていません。 Impalaでどうすればきれいに書き直すことができますか？ AnalysisException： SELECT col1, col2, ... CASE WHEN (SELECT 1 FROM table1 x,

0熱

1答えて

Julian DatesとGregorianをインパラで換算する

日付がユリウス暦の日付である表があり、これらの日付をカレンダーの日付に変換したいと考えています。ここでは、私が持っているユリウス日付のサンプルです：カレンダーの日付で2457395. それはする必要があります：07012016（DDMMYYYY）。日付を（01/01/1900）からの日数に変換しようとしましたが、入力として日数を指定する方法がわからなくても、事前に感謝します。

0熱

1答えて

Hive JDBCエラー：java.lang.NoSuchFieldError：HIVE_CLI_SERVICE_PROTOCOL_V7

Hive2コネクタを使用してImpalaにJDBC経由で接続を作成しようとしています。 <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>1.1.0</version> </dependency> <depen

-5熱

1答えて

ハイブ、インパラ、ビーラインの違い

Hadoopエコシステムツールを初めて使用しています。誰でもハイブ、ビーライン、ハイブの違いを理解するのに役立つことができます。ありがとうございます！

-3熱

1答えて

2つのテーブルの平均を取っていますか？

私は、だから私は2つのテーブル私は、この2台の平均を取得できますかを持って ^^事前にあなたの助けのために〜おかげSQLコマンドのヘルプが必要。私が欲しい結果は Country Code 65 has 49.5 Frequency Country Code 42 has 17 Frequency Country Code 33 has 18 Frequency Country Code

0熱

1答えて

インパラ組み込み関数は利用できませんインパラからSparkSQL

にを移行するとき、私は次のようにインパラでの組み込み関数を使用しています。今、私は（Jupyterノートでpysparkを使用して）SparkSQLに移行しています select id, parse_url(my_table.url, "QUERY", "extensionId") from my_table ：また、以下試してみました NameError: name 'parse_url'