apache-pig

    0

    1答えて

    と豚に2つの関係を結合するために私は2つのCSVファイルをしました: の1- Fertiltiy.csv: 2 - ライフExpectency.csv: 結果は次のようになります。 私は豚に新しいです、私は正しい答えを得るが、ここに私のコードであることができませんでした。ここで fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.H

    0

    1答えて

    問題が発生しました。デフォルトのゾーンがグローバルに実行されているので、コードをDataProcPigOperatorで作成しますが、asia-easth1コードではクラスタ内の定義領域を変更します。DataProcPigOperatorはグローバル領域を実行するデフォルトジョブであるため実行されません。任意の解決策.. ?? t1 = DataProcPigOperator( task

    0

    1答えて

    歩行者の総歩数と最高歩数を数え上げるためのスクリプトを作成しました。私が得られないことは、Pig Outputでヘッダーを生成することです。その結果、出力はすっきりとしてきれいに見えます。出力の書き込み中にヘッダーを生成する方法はありますか?私のコードがされた後、私の出力の register 'piggybank-0.15.0.jar'; DEFINE CSVLoader org.apache.

    0

    1答えて

    私はブタに2つのデータオブジェクトを持っています。 DATA_1: col_a: chararray, col_b: int, col_c: int, col_d: chararray DATA_2:私はそれらの2に参加したい col_a: chararray, col_b: chararray, col_c: int, col_d: int, col_e: int 、私が試

    0

    1答えて

    で変数を比較私は三つの変数(すでに同じ豚のプログラムで計算)、すなわちredcount、greencountとbluecount私は彼らの値を比較し、名前と3の最大を表示したい を持っています。 countryflags = LOAD '/home/rahul/countryprojectdata/Country.txt' USING PigStorage(',') AS (country:cha

    0

    1答えて

    Pig Latinでコードを作成し、その出力をHiveテーブルに保存したいとします。私はこのスクリプトを実行しようとすると、私は、 register 'piggybank-0.15.0.jar'; DEFINE CSVLoader org.apache.pig.piggybank.storage.CSVLoader(); part1 = LOAD '/home/cloudera/Pedestr

    0

    1答えて

    ブタスクリプトの実行中にエラー2017-10-29 03:34:22,212 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 6, column 13> Syntax error, unexpected symbol at or near ''/home/harsh/Hunny/HadoopPractice/Pig

    0

    1答えて

    私が書いた豚のスクリプトは、私のローカルでは4GBのデータで実行されていますが、EMRクラスターで実行しようとすると、特定のグループのステートメントでハングアップしています。 org.apache.tez.dag.app.dag.impl.AMUserCodeException::、エッジを初期化するためにEdgeInfo失敗:私は取得しています...によって引き起こさ at org.apache

    -1

    1答えて

    私は奇妙な状況があります。私はtest1のユーザーとして豚のスクリプトを実行している場合は、スクリプトが正常に実行:ハイブテーブル にcsvファイル格納データから pig -param_file /tmp/pig_parameters.param -param DBNAME=default -param TABLENAME=test_pig_table_orc -param FPATH=/data

    0

    2答えて

    を使用してファイルから2番目のレコードを取得する私のデータは、このようなものですBotany)、さらに操作をしたいと思っています。 私はLIMITコマンドを使ってみましたが、特定のレコードではなく、いくつかのレコードを取得します。