私は外部の寄木張りファイルの負荷の上に構築されたハイブテーブルを持っています。 Paruqetファイルは、スパークジョブによって生成されるべきですが、メタデータフラグをfalseに設定することによって生成されませんでした。私はそれがいくつかの痛みのない方法でそれを復元することが可能かどうか疑問に思っています。寄木細工のファイルのメタデータを生成
/apps/hive/warehouse/test_db.db/test_table/_SUCCESS
/apps/hive/warehouse/test_db.db/test_table/_common_metadata
/apps/hive/warehouse/test_db.db/test_table/_metadata
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-20
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-21
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-22
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-23
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-24
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-25
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-26
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-27
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-28
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-29
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-30
はのは、ファイル_metadata
が存在しないか、時代遅れであると仮定しよう:以下のようにファイルの構造があります。 hiveコマンドで再作成する方法はありますか?スパークジョブ全体を開始する必要はありません。
@Niemand最新のコメントで質問を編集してください。 –
_metadataは、.parquetファイルと一緒にパーティション化されたフォルダの内側にはありませんか?また、あなたはsparkシェルからファイルを読むことができますか? –
はい、いくつかのメタデータはファイル自体に存在し、はい、それらはsparkシェルとハイブの両方からクエリ可能です。これは、この特定の_metadataファイルが存在しなければ、ハイブのクエリ処理がはるかに遅いと私は思っています。 – Niemand