hive

    0

    1答えて

    私は2つだけの列が含まテーブルがありますsession_id, word_idを、テーブルがsession_word である私たちは、以下のSQLクエリとして2つの値を取得することができます。 select count(*) as sum_word_freq from session_word select count(distinct session_id) as sum_session_fr

    0

    1答えて

    私はpysparkに取り組んでいます。ハイブテーブルからデータを読み込み、すべての列と行番号を含むpysparkデータフレームを返すクエリを書く必要があります。 これは私が試したものです: SELECT *, ROW_NUMBER() OVER() as rcd_num FROM schema_name.table_name このクエリはハイブで正常に動作しますが、私はpysparkスクリプト

    0

    1答えて

    sqoopを使用してmysqlからハイブをインポートしました。終了したら、いくつかの列が正しくない列が見つかりました。ここで bin/sqoop import -Dhadoop.security.credential.provider.path=mypath --table mytable --hive-overwrite --hive-table myhivetable --username

    0

    1答えて

    インデックスは、テーブルの特定の列のポインタに過ぎません。インデックスを作成するとは、テーブルの特定の列にポインタを作成することです。ある列が表内で索引付けされていて、その特定の列のデータがどのように指し示されているかは、その特定の列が照会されたときですか?

    0

    2答えて

    ユーザーが4種類の値を選択し、関連するデータがUIに表示されるバックエンドにhive dbを持つWebアプリケーションがあります。 例フィールドは次のようになります。 プロジェクトID サブポートフォリオ プロジェクトステータス プロジェクト・ファイナンスの状況 ユーザーが言及したフィールドに異なる値を選択することができます(単一または複数)とデータの要求。 私は複数のIN句で1つのハイブクエリを

    0

    1答えて

    最近ハイブの学習を始めました。私は次の値を持つpythonリストを持っています list=['hello:struct', 'env:string', 'element:struct','AppId:string','processId:string'] したがって、上記の値を使用してハイブDDLを作成する必要があります。これに似ています。 create table demo { he

    0

    1答えて

    私はload_date(DD-MM-YYYY)でパーティション化された外部ハイブテーブルを持っています。しかし、最初の期間では、01-01-2000には1980年から2000年までのすべてのデータが含まれています。既存のデータを保持しながら前のデータのパーティションをさらに作成するにはどうすればよいですか?(ロード日付のデータは01-01-2000 )

    0

    1答えて

    私はウィンドウ上でcollect_listを作成しようとしていますが、同じテーブルの1つのカラムの値に基づいてウィンドウのサイズを動的に制限します。 select concat_ws('->', collect_list(CASE WHEN b.colA IN ("bla", "blabla") THEN concat_ws("-", colB,colC) END) OVER (PARTITION

    0

    1答えて

    ネストされたJSONに外部ハイブテーブルを照会することができません原因 Error: java.io.IOException: org.apache.hadoop.hive.serde2.SerDeException: org.codehaus.jackson.JsonParseException: Current token (VALUE_STRING) not numeric, can not

    0

    1答えて

    ちょうど同じ内容の2つのハイブテーブルt1とt2を持っています。以下に示すように、2つのカラム 'a'と 'b' 9行。 1 a 2 b 3 c 4 d 5 e 6 f 7 g 8 h 9 i 問題は、以下のhive_QLは何も得ないということである select t2_t.a, t2_t.m from (select a,