0
HDFSにはパーティションのコンベンションに従うディレクトリ構造のtsvファイルがたくさんあります。ここではevent_dt
がパーティションです。ハイブのパーティションを持つ外部テーブル
some_path/event_dt=2017-04-30
some_path/event_dt=2017-05-01
などとなる。
event_dtも列の1つです。特に第2のもの。しかし、event_dt
はテーブルスキーマとPARTITIONED BY
ステートメントには出現できないので、これを指定することはできません。これにより、次のようなトリガーが発生します。
Column repeated in partitioning columns
別の名前を使用する以外に方法がありますか。それは結局、同じ情報です。
データをロードするたびに 'event_dt 'に基づいて動的パーティションを作成しますか? – philantrovert
非パーティション列の名前を変更しない理由は何ですか? –
全く同じことを指す2つの名前を持つことは、私が推測するにはちょっと変わったと感じます – elelias