apache-pig

0熱

1答えて

私は豚のスクリプトを開発しており、数字は4桁ですが、6桁の数字で表示する必要があります。 ex: 6001 should be displayed as 006001. ありがとうございます。

0熱

1答えて

MongoInsertStorage with PIGを使用してHDFSからMongoDBにファイルをインポートしようとしています。ファイルは大きく、約5GBです。私は pig -x local example.pig とローカルモードでそれを実行すると、スクリプトは、私はMapReduceのモードでそれを実行する場合は、マッパーのほとんどは、次のエラーで失敗する細かい動作します： Error

1熱

1答えて

HBaseテーブルから値を取得する方法は？

私はaと呼ばれる1つの列ファミリと約30列のHbaseテーブルを持っています。以下 ROW COLUMN+CELL 00:001000574 column=a:aasbig, timestamp=1486493154559, value=true 00:001000574 column=a:aasdel, timestamp=1486493154559, v

1熱

1答えて

Google Cloud DataprocからPigジョブを送信してもPigクラスパスにカスタムjarが追加されない

Google Cloud DataprocでPigジョブを送信しようとしていますが、Pigスクリプトで使用するカスタム読み込み機能を実装するカスタムJar私はそれをする方法を見つけることができません。 UIからカスタムjarを追加すると、Pigクラスパスに追加しないでください。ここでは、それが私のクラスを見つけることができない示す、豚ジョブの出力です：豚スクリプト内のカスタムジャーを登録 17/

0熱

1答えて

apache pig、idでグループ化された値の順列

Apache Pigを使用すると、idフィールド（この場合は 'title'）でグループ化されたフィールドのすべての順列が必要です。入力されたデータは、次のようになります。スキーマ私は1つのリストでTITLE1名の関係とTITLE2名の関係のすべての順列を必要とする{chararray、chararray} (title1, name1) (title1, name2) (title1, n

1熱

1答えて

ブタ負荷：deprecatedプロパティfs.default.name

私はHadoop 2.6.5をインストールしましたが、同じマシンにPig 0.16をインストールしました。私は豚を実行し、 a = load '/user/hduser/input/palabras.txt';を使用してファイルをロードしました。この情報はINFO org.apache.hadoop.conf.Configuration.deprecation - fs.default.name

0熱

1答えて

.datファイルをハイブまたはhdfsにロードする方法は？

.datファイルをハイブまたはclouderaまたはhdfsにロードする方法はありますか。ブタを使用してこの形式を構造化形式に変換する必要がありますか？もしそうなら、誰かがこれを構造データに変換するブタスクリプトを与えることができますか？私のデータは、私は++メモ帳で.datファイルを開くとこのようになります Americas¤AME ¤ZONE¤ ¤¤¤Active¤ Asia-Paci

-2熱

2答えて

PIG

スキーマのデータからMIN EFF_DTとMAX_CANC_dtを取る： TYP|ID|RECORD|SEX|EFF_DT|CANC_DT DMF|1234567|98765432|M|2011-08-30|9999-12-31 DMF|1234567|98765432|M|2011-04-30|9999-12-31 DMF|1234567|98765432|M|2011-04-30|99

0熱

2答えて

ディバイドタプル

Iは、同じ量のデータが含まれていないタプルを有する：（A、B、C、D）（E、F）（G、H、I）を（a）の（b）の（C）（D）（e）の（F） 012：私がやりたい何は、各データのための新しいタプルを作成することです（G）（H）（I）の助けあなたが関係Aを持っていると仮定すると