2017-06-20 12 views
-1

Hiveテーブルにデータを挿入しようとすると、次の問題が発生します。データフレームからHiveテーブルにデータを保存する際にエラーが発生しました

によるステージ障害のために中止されまし求人:段階65.0で失われたタスク5.3(TID 987、 tnblf585.test.sprint.com):java.langの段階65.0でタスク5は4 回、最新の障害が失敗しました.ArrayIndexOutOfBoundsException: org.apache.spark.sql.catalyst.expressions.BaseGenericInternalRow $ class.getAs(で : で 45 org.apache.spark.sql.catalyst.expressions.GenericMutableRow.genericGet(254 rows.scala) rows.scala:35) at org.apache.spark.sql.catalyst.expressions.BaseGenericInternalRow $ class.isNullAt(rows.scala:36) at org.apache .spark.sql.catalyst.expressions.GenericMutableRow.isNullAt(rows.scala:248) ( )org.apache.spark.sql.hive.execution.InsertIntoHiveTable $$ anonfun $ org $ apache $ spark $ sql $ hive $ execution $ InsertIntoHiveTable $$ writeToFile $ 1 $ 1.apply(InsertIntoHiveTable.scala:107) org.apache.spark.sql.hive.execution.InsertIntoHiveTable $$ anonfun $ org $ apache $ spark $ sql $ hive $実行$ InsertIntoHiveTable $ $ writeToFile $ 1 $ 1.apply(InsertIntoHiveTable.scala:104) at scala.collection.Iterator $ class.foreach(Iterator.scala:727)at scala.collection.AbstractIterator.foreach(Iterator.scala:1157)at org .apache.spark.sql.hive.execution.InsertIntoHiveTable.org $ apache $ spark $ sql $ hive $実行$ InsertIntoHiveTable $$ writeToFile $ 1(InsertIntoHiveTable.scala:104) ()org.apache.spark.sql.hive.execution.InsertIntoHiveTable $$ anonfun $ saveAsHiveFile $ 3.apply(InsertIntoHiveTable.scala:84) at org.apache.spark.sql.hive.execution.InsertIntoHiveTable $$ anonfun $ saveAsHiveFile $ 3.apply(InsertIntoHiveTable.scala:84) at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:66) at org.apache.spark.scheduler.Task.run(Task.scala:89) でjava.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145) java.util.concurrentの時: org.apache.spark.executor.Executor $ TaskRunner.run(227 Executor.scala)で。 ThreadPoolExecutor $ Worker.run(ThreadPoolExecutor.java:615) at java.lang.Thread.run(Thread.java:745)

ドライバースタックトレース:

+0

正しくロードされた列名の補正後とすることを、それを考え出しましたどのようにハイブテーブルに挿入しようとしていますか。ログ内に送出されるセクションアウトの配列。データが矛盾している可能性があります。あなたのデータをチェックしてください。 – Kris

+0

特定のものは求めていません。ソースコードを提供していない、サンプルデータを提供していない、ターゲットテーブル構造を提供していない、Spark/Hiveのバージョンは言及していません。あなたは本当に答えを得ることを望んでいますか? –

答えて

0

は、私がデータフレームとハイブテーブルの列名のいずれかが、同じではありません、それはそれは何をクリアしていない

関連する問題