impala

    0

    1答えて

    ハイブロード: 以下のコマンドを使用して、外部サーバーまたはリモートマシンからハイブテーブルにデータをロードします。通常、この文はhadoopローカルエッジノードから動作します。 のデータのロードローカルINPATHのローカルファイルシステムは 'テーブルに上書き hive_table

    1

    1答えて

    私はClouderaのクラスタ impala-shell -i connect 10.223.121.11:21000 -d prod_db -f /home/cloudera/views/a.hql に以下のインパラコマンドを実行しようとしていますが、私は Error, could not parse arguments "10.223.121.11:21000" としてエラーを取得する

    1

    1答えて

    HBaseの30の異なるテーブルに約5TBのデータが分散されています。 私の使用例は、各テーブルのYEARである2つの特定の列に基づいており、国ごとに5Kの異なるテキストファイルを作成する必要があります。 私はこの目的でHIVEとHBaseを統合しましたが、HIVEからの抽出には非常に時間がかかります。 私は10時間以内にこれを終わらせなければなりません。 これを達成するためのアイデアを探してくだ

    1

    1答えて

    Cloudera Managerを使用してHadoopクラスタをインストールし、現在Impalaデーモンがすべてのデータノードで実行されています。クラスタはゲートウェイ/エッジノードの背後にあり、エッジノードにはゲートウェイサービスのみがインストールされます(たとえば、httpfs、ハイブゲートウェイ、スパークゲートウェイ、oozie)。 すべてのインパラデーモンがクラスタのデータノード上で実行さ

    1

    2答えて

    このようなクエリがあり、明らかにImpalaはSELECT文でサブクエリをサポートしていません。 Impalaでどうすればきれいに書き直すことができますか? AnalysisException: SELECT col1, col2, ... CASE WHEN (SELECT 1 FROM table1 x,

    0

    1答えて

    日付がユリウス暦の日付である表があり、これらの日付をカレンダーの日付に変換したいと考えています。ここで は、私が持っているユリウス日付のサンプルです:カレンダーの日付で2457395. それはする必要があります:07012016(DDMMYYYY)。 日付を(01/01/1900)からの日数に変換しようとしましたが、入力として日数を指定する方法がわからなくても、 事前に感謝します。

    0

    1答えて

    Hive2コネクタを使用してImpalaにJDBC経由で接続を作成しようとしています。 <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>1.1.0</version> </dependency> <depen

    -5

    1答えて

    Hadoopエコシステムツールを初めて使用しています。 誰でもハイブ、ビーライン、ハイブの違いを理解するのに役立つことができます。 ありがとうございます!

    -3

    1答えて

    私は、だから私は2つのテーブル私は、この2台の平均を取得できますか を持って ^^事前にあなたの助けのために〜 おかげSQLコマンドのヘルプが必要。私が欲しい 結果は Country Code 65 has 49.5 Frequency Country Code 42 has 17 Frequency Country Code 33 has 18 Frequency Country Code

    0

    1答えて

    に を移行するとき、私は次のようにインパラでの組み込み関数を使用しています。今、私は(Jupyterノートでpysparkを使用して)SparkSQLに移行しています select id, parse_url(my_table.url, "QUERY", "extensionId") from my_table :また、以下試してみました NameError: name 'parse_url'