2017-10-26 7 views
0

Pig Latinでコードを作成し、その出力をHiveテーブルに保存したいとします。私はこのスクリプトを実行しようとすると、私は、HCatStorerを使用しているときにPigにエラーが発生しました

register 'piggybank-0.15.0.jar'; 
DEFINE CSVLoader org.apache.pig.piggybank.storage.CSVLoader(); 
part1 = LOAD '/home/cloudera/Pedestrian_Counts.csv' using CSVLoader(',') as (date_time, sensor_id: int, sensor_name: chararray, hourly_counts: int); 
part2 = GROUP part1 BY (sensor_id, sensor_name); 
part3 = FOREACH part2 GENERATE FLATTEN(group) AS (sensor_id, sensor_name), SUM(part1.hourly_counts), MAX(part1.hourly_counts); 
STORE part3 into 'pedestrian_count' USING org.apache.hcatalog.pig.HCatStorer(); 

を、スキーマでハイブのテーブルを作成し

create table pedestrian_count(sensor_id INT, sensor_name STRING, total_hourly_counts BIGINT, highest_count INT) 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ':' 
STORED AS TEXTFILE 
location '/user/cloudera/output'; 

そして、私の豚のスクリプトがあるが、私はエラーを取得しています

Pig Stack Trace 
--------------- 
ERROR 1070: Could not resolve org.apache.hcatalog.pig.HCatStorer using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.] 

org.apache.pig.impl.logicalLayer.FrontendException: ERROR 1000: Error during parsing. Could not resolve org.apache.hcatalog.pig.HCatStorer using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.] 
    at org.apache.pig.PigServer$Graph.parseQuery(PigServer.java:1701) 
    at org.apache.pig.PigServer$Graph.access$000(PigServer.java:1421) 
    at org.apache.pig.PigServer.parseAndBuild(PigServer.java:354) 
    at org.apache.pig.PigServer.executeBatch(PigServer.java:379) 
    at org.apache.pig.PigServer.executeBatch(PigServer.java:365) 
    at org.apache.pig.tools.grunt.GruntParser.executeBatch(GruntParser.java:140) 
    at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:202) 
    at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:173) 
    at org.apache.pig.tools.grunt.Grunt.exec(Grunt.java:84) 
    at org.apache.pig.Main.run(Main.java:613) 
    at org.apache.pig.Main.main(Main.java:158) 
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
    at java.lang.reflect.Method.invoke(Method.java:606) 
    at org.apache.hadoop.util.RunJar.run(RunJar.java:221) 
    at org.apache.hadoop.util.RunJar.main(RunJar.java:136) 
Caused by: Failed to parse: Pig script failed to parse: <file pedestrian.pig, line 6, column 42> pig script failed to validate: org.apache.pig.backend.executionengine.ExecException: ERROR 1070: Could not resolve org.apache.hcatalog.pig.HCatStorer using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.] 
    at org.apache.pig.parser.QueryParserDriver.parse(QueryParserDriver.java:196) 
    at org.apache.pig.PigServer$Graph.parseQuery(PigServer.java:1688) 
... 16 more 
Caused by: <file pedestrian.pig, line 6, column 42> pig script failed to validate: org.apache.pig.backend.executionengine.ExecException: ERROR 1070: Could not resolve org.apache.hcatalog.pig.HCatStorer using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.] 
    at org.apache.pig.parser.LogicalPlanBuilder.validateFuncSpec(LogicalPlanBuilder.java:1275) 
    at org.apache.pig.parser.LogicalPlanBuilder.buildFuncSpec(LogicalPlanBuilder.java:1260) 
    at org.apache.pig.parser.LogicalPlanGenerator.func_clause(LogicalPlanGenerator.java:5153) 
    at org.apache.pig.parser.LogicalPlanGenerator.store_clause(LogicalPlanGenerator.java:7751) 
    at org.apache.pig.parser.LogicalPlanGenerator.op_clause(LogicalPlanGenerator.java:1669) 
    at org.apache.pig.parser.LogicalPlanGenerator.general_statement(LogicalPlanGenerator.java:1102) 
    at org.apache.pig.parser.LogicalPlanGenerator.statement(LogicalPlanGenerator.java:560) 
    at org.apache.pig.parser.LogicalPlanGenerator.query(LogicalPlanGenerator.java:421) 
    at org.apache.pig.parser.QueryParserDriver.parse(QueryParserDriver.java:188) 
... 17 more 
Caused by: org.apache.pig.backend.executionengine.ExecException: ERROR 1070: Could not resolve org.apache.hcatalog.pig.HCatStorer using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.] 
    at org.apache.pig.impl.PigContext.resolveClassName(PigContext.java:653) 
    at org.apache.pig.parser.LogicalPlanBuilder.validateFuncSpec(LogicalPlanBuilder.java:1272) 
、など

誰でも私が間違って行ったことを教えてください。前もって感謝します。

答えて

1

私は以下のコマンドを使用して、グラントシェルに入る必要があると思います。

pig -useHCatalog 

たちはハイブのlibからすべての必要なjarを登録HCatalog -use使用する必要がハイブに対処することを示してthisリンクを参照してください。

第二の提案: 以下のコマンドを使用してみてください:

STORE part3 into 'pedestrian_count' USING org.apache.hive.hcatalog.pig.HCatStorer(); 

は、以下のようにパート3を置き換える:返信用

part3 = FOREACH part2 GENERATE FLATTEN(group) AS (sensor_id, sensor_name), SUM(part1.hourly_counts) AS total_hourly_counts, MAX(part1.hourly_counts) AS highest_count; 
+0

感謝を。私はあなたが提案したのと同じコマンドを実行したときにエラーが発生しました。私から与えられた命令は '豚 - 使徒キャタリスト 'です。私は 'pig -useHCatalog'コマンドを与えてみました。それでもエラーは同じです。 –

+0

私は私の答えを編集しました。 –

+0

ここで、 'pedestrian_count'はテーブル名です。私は上記のスキーマを使用してそれをbeelineで作成しました。あなたの提案を試した後、エラーが発生しました。 'ERROR 1115:フィールドの列名が指定されていません。 HCatStorer'の引数として完全なスキーマを提供してください。しかし、私はすべての列名を宣言していると思います。 –

関連する問題