impala

    0

    1答えて

    すべて、 hive2トランプサーバーからデータを読み込もうとしています。私はhereと似た分析をしたいと思います。ここに私の現在のプロセスがあります。 import blaze as bz import sqlalchemy import impala conn = connect(host='myhost.url.com', port=10000, database='mydb', us

    0

    1答えて

    CDHのすべてのサービスとコンポーネントのリリースのClouderaロードマップを見つける方法を知っている人はいますか?私はここに見ることができますhttps://www.cloudera.com/documentation/enterprise/release-notes/topics/impala_incompatible_changes.html#incompatible_changes_2

    0

    1答えて

    クエリでフィールドの最初の100文字のみを返すことはできますか?これが可能である、 select text from my_table しかし、今、私は唯一のコラム「テキスト」の最初の100文字にしたい: 例えば、私のオリジナルクエリがありますか?ありがとう!

    0

    1答えて

    私はpandas.HDFStore()のパンダでHDF5に約800 GBの巨大なデータフレームを保存しました。 import pandas as pd store = pd.HDFStore('store.h5') df = pd.Dataframe() # imagine the data being munged into a dataframe store['df'] = df 私

    0

    1答えて

    複数のユーザーにアクセスできるHadoopクラスタ(Clouderaディストリビューション)が1つあります。今はさまざまなユーザーからデータベースを作成しています。どのユーザーがどのデータベースを作成しているかを確認するには?誰も私を示唆することはできますか?

    0

    1答えて

    ハイブテーブルに列があり、その列をクエリするのにimpalaとハイブの両方を使用したいので、10進数の10進数まで丸める必要があります。 すなわちtest_column = 32.542999471999998 選択test_columnは32.5429994720を返す必要があります。このような値を返すためにselectクエリで使用できる関数は何ですか?

    0

    1答えて

    複数の列に外部結合テーブルAとテーブルBを残したいとします。 select * from table_A left outer join table_B on (table_A.a1 = table_B.b1) left outer join table_B on (table_A.a2 = table_B.b2) しかし、私はエラーを得た:以下の私

    2

    2答えて

    インパラの時間がGMT形式で表示されているときに、ハイブのタイムスタンプにdatefeildをfrom_unixtime(unix_timestamp(), 'yyyy-MM-dd HH:mm:ss') as timestamp) as column_name,としてキャストしています。すべてのタイムスタンプフィールドを作成した列だけでなく、GMT形式に変換しています。 時刻を表示する方法は?また