apache-pig

    0

    1答えて

    私は豚のスクリプトを開発しており、数字は4桁ですが、6桁の数字で表示する必要があります。 ex: 6001 should be displayed as 006001. ありがとうございます。

    0

    1答えて

    MongoInsertStorage with PIGを使用してHDFSからMongoDBにファイルをインポートしようとしています。ファイルは大きく、約5GBです。私は pig -x local example.pig とローカルモードでそれを実行すると、スクリプトは、私はMapReduceのモードでそれを実行する場合は、マッパーのほとんどは、次のエラーで失敗する細かい動作します: Error

    1

    1答えて

    私はaと呼ばれる1つの列ファミリと約30列のHbaseテーブルを持っています。以下 ROW COLUMN+CELL 00:001000574 column=a:aasbig, timestamp=1486493154559, value=true 00:001000574 column=a:aasdel, timestamp=1486493154559, v

    1

    1答えて

    Google Cloud DataprocでPigジョブを送信しようとしていますが、Pigスクリプトで使用するカスタム読み込み機能を実装するカスタムJar私はそれをする方法を見つけることができません。 UIからカスタムjarを追加すると、Pigクラスパスに追加しないでください。ここで は、それが私のクラスを見つけることができない示す、豚ジョブの出力です:豚スクリプト内のカスタムジャーを登録 17/

    0

    1答えて

    Apache Pigを使用すると、idフィールド(この場合は 'title')でグループ化されたフィールドのすべての順列が必要です。入力されたデータは、次のようになります。 スキーマ私は1つのリストでTITLE1名の関係とTITLE2名の関係のすべての順列を必要とする{chararray、chararray} (title1, name1) (title1, name2) (title1, n

    1

    1答えて

    私はHadoop 2.6.5をインストールしましたが、同じマシンにPig 0.16をインストールしました。私は豚を実行し、 a = load '/user/hduser/input/palabras.txt';を使用してファイルをロードしました。この情報はINFO org.apache.hadoop.conf.Configuration.deprecation - fs.default.name

    0

    1答えて

    .datファイルをハイブまたはclouderaまたはhdfsにロードする方法はありますか。 ブタを使用してこの形式を構造化形式に変換する必要がありますか? もしそうなら、誰かがこれを構造データに変換するブタスクリプトを与えることができますか? 私のデータは、私は++メモ帳で.datファイルを開くとこのようになります Americas¤AME ¤ZONE¤ ¤¤¤Active¤ Asia-Paci

    -2

    2答えて

    スキーマのデータからMIN EFF_DTとMAX_CANC_dtを取る: TYP|ID|RECORD|SEX|EFF_DT|CANC_DT DMF|1234567|98765432|M|2011-08-30|9999-12-31 DMF|1234567|98765432|M|2011-04-30|9999-12-31 DMF|1234567|98765432|M|2011-04-30|99

    0

    2答えて

    Iは、同じ量のデータが含まれていないタプルを有する: (A、B、C、D) (E、F) (G、H、I)を (a)の (b)の (C) (D) (e)の (F) 012:私がやりたい何 は、各データのための新しいタプルを作成することです(G) (H) (I)の助けあなたが関係Aを持っていると仮定すると