私はcsv、xml、jsonのようなフォーマットのデータを受信しています。すべてのファイルを同じハイブテーブルに保存したいと思いますか?同じハイブテーブルに異なるファイル形式のデータを保存することはできますか?
1
A
答えて
0
はい、これは異なる外部表の組み合わせによって実現できます。
異なるファイルの列を読み込む方法が異なるさまざまなSerDesが必要になるため、ファイル(および表)の種類ごとに1つの外部表を作成する必要があります。これらの外部表のそれぞれからのデータは、Rameshによって提案されたように、UNIONでビューに結合できます。ビューは、これらから読み込むために使用することができます。管理対象テーブルにデータを挿入します。
1
ハイブは、1つのテーブルのすべてのファイルが同じデリミタ、同じ圧縮が適用されると期待しています。したがって、複数のフォーマットのファイルの上にハイブテーブルを使用することはできません。あなたが使用することをお勧めします
ソリューションは
- で別のテーブルを作成します(JSON/XML/CSV)ファイル形式
- のそれぞれについて、上記で作成した3つのテーブルのUNIONのビューを作成します。 。
このようにして、データの消費者は、それが探しているものであれば、1つのビュー/オブジェクトのみをクエリする必要があります。
関連する問題
- 1. ハイブテーブルを.xlsx形式で保存する方法は?
- 2. 異なるファイル形式を保存する
- 3. Azureの保存ファイルのローカルファイル(同じファイル)と異なるMD5チェックサム
- 4. 異なるビューコントローラのデータを保存して、同じtableviewcellで表示することは可能ですか?
- 5. このjson形式でデータを保存する方法は?
- 6. System.Drawing.Imageデータは、ファイルとストリームに保存するときに異なります
- 7. データフレームとcsvファイルの日付形式を同じにすることはできますか?
- 8. Javaの表形式のデータ形式とはどのように表形式のデータ形式を文字列配列の一覧に保存できますか?
- 9. クライアントマシンにjsonデータをどのような形式で保存できますか?
- 10. Pythonは異なる形式での保存配列をnumpyの
- 11. 画像をさまざまなファイル形式に保存する
- 12. PythonのデータをAccessファイルに保存することはできますか?
- 13. SQL異なる形式の時間を保存する(mm:ss、mmm)
- 14. 形式anglejsとlaravelからデータとファイルを保存
- 15. .cpp形式のファイルをVCExpressに.cpp.9.0形式で保存できません。
- 16. オブジェクトからJSON形式のファイルにデータを保存する方法は?
- 17. 同じソリューション内の異なるプロジェクトにリソースファイルを保存する
- 18. mongodbはデータを保存するときに同じObjectIDを生成します
- 19. 同じAPI内の異なるエンドポイントが異なる日付形式を返すのはなぜですか?
- 20. 異なるCppcheckの結果を同じXmlファイルに保存する方法
- 21. データの保存形式前
- 22. Notepad ++でtsvファイルを開き、テキスト形式で保存する
- 23. Sparkからファイルをフェザー形式で保存する方法は?
- 24. Cassandraにマトリックス形式でデータを保存しますか?
- 25. HadoopのMultipleInputクラスで異なるタイプの入力形式ファイルを渡すことはできますか?
- 26. 1つのクリックボタンで同じ属性名で異なるデータ値をプルすることはできますか?
- 27. 機能を保存するのに最適なデータ形式ですか?
- 28. 異なるGoogle Playアカウントで、同じキーで異なるアプリに署名することはできますか?
- 29. ExcelファイルをCSV形式で保存するには?
- 30. 異なるスレッドが同じVecの異なるセクションに書き込むことはできますか?
誤っています。 'Parquet'として保存されたパーティションテーブルを作成し、' alter table'を作成してデフォルトをCSVに変更します(既存のパーティションに変更をカスケードせずに)。次に新しいパーティションを作成します。しかし、私はそれが非常に、非常に汚れたハックだと認めます。 –
また、圧縮オプションは動的に管理されます。同じフォルダに '.csv'ファイルと' .csv.gz'ファイルがある場合、それぞれのタイプは適切な圧縮コーデックで読み込まれます。 –