amazon-redshift

    0

    2答えて

    特定の基準(企業ID、職種、性別、時間枠、状態ID、状態)を満たすデータセット内の女性の割合を調べようとしています。種類。これを行うには、この基準を満たす女性の合計数を、基準を満たす男性と女性の合計数で除算しなければなりません。 私は現在、親切とid = 0で、すべての時間から、エンジニアリングでは、同社20から#女性を見つけるために、データを照会し、その基準を満たす合計#男性と女性で、それを分割

    1

    1答えて

    表形式のデータをJSON形式に変換し、それをRedshiftの別の表に保存する方法がわかりません。たとえば、という4つの列を持つ表があります。pid,stid,item_id,trans_id。 pid,stid,item_idの各組み合わせに対して、多くはtrans_idsが存在します。 pid stid item_id trans_id : 1 , AB , P1 , T1 1 , AB

    0

    1答えて

    Redshiftでこれをビルドする機能はありますか?インターリーブされたキーはこれを何らかの形で緩和します。 化合物による並べ替えとインターリーブされたものがある場合は、これが理想的です。 パーティションビューを使用することには欠点がありますか?私は以下のように意味します。 https://sqlsunday.com/2014/08/31/partitioned-views/ しかし代わりの日付を

    0

    1答えて

    次のコードは、S3からデータを読み込み、SparkSQLを使用して重複を消去し、JDBCを使用してデータをRedshiftに保存します。私はまた、spark-redshiftの依存関係を使用して同じ結果を得ようとしました。私はSpark 2.0を使用しています。 私が理解できないことは、メモリにロードされた結果を表示するときに、合計が予想される数値であることです。ただし、スパークがレッドシフトに保

    0

    1答えて

    データをロードしようとしていました。 49.9999〜数値(9,4)列。どのくらいコピーコマンドを使用して、値を二捨五入して50.00にしています。 コピーコマンドサンプル: COPY <table_name> (PRICE_BAND_CODE,PRICE_BAND_DESC,PROD_LEVEL1_CODE,PRICE_BAND_LOWER,PRICE_BAND_UPPER,PRICE_BAND

    0

    2答えて

    最終的に、私は最後の2週間(例えば)に質問されていない特定のスキーマ内のテーブルのリストを取得したいと思います。 I know Redshiftクラスタがどのように機能しているかについてさまざまなものを追跡するシステムテーブルが多数ありますが、上記を得るために使用できるものはまだありません。 私ができることは可能ですか?

    0

    1答えて

    ここに例のようなタイムスタンプ文字列があります: 2017-07-12T01:51:12.732-0600。これを使用してこれをUTCに正確に変換する関数/関数の組み合わせはありますか? 出力は2017-07-12 07:51:12.732000である必要があります。私はto_timestampとconvert_timezoneを使ってみました。明らかに、後者は失敗しましたが、前者は失敗してしまい

    0

    1答えて

    Redshiftは先読みアサーションをサポートしていないため、部分文字列一致を見つける方法が必要ですが、パターンそのもの。 もちろん、substring()を使用することもできますが、部分文字列の一致がない場合は、完全な文字列が返されます。このアプローチは、厳格なケース・ステートメントの使用を必要とし、適切ではない。正規表現を使用して は理想的である - 例えば: The quick brown

    0

    1答えて

    redshiftでunloadコマンドを実行して、テーブルからCSVファイルにデータをダンプしようとしています。この表には、文字フィールドと数値フィールドがあります。文字フィールドにはコンマ(、)が含まれている可能性があるので、引用符が必要です。しかし、私は数値列を引用符で囲む必要はありません。 次のコマンドは私が一番近かったものですが、引用符を取り除くことができません。どのようにして目的の結果を