2017-09-28 16 views
0

LazySimpleSerDeを使用しているときAWS Athenaがコレクションフィールドを正しくロードできないようです。 collection.delimを設定しても効果はありません。 thusly使用時:アテナがLazySimpleSerDeでコレクションを解析できない

WITH SERDEPROPERTIES (
'serialization.format' = '|', 
'field.delim' = '|', 
'collection.delim' = ',', 
'line.delim' = '\n', 
'mapkey.delim' = '@' 
) 

これは(わずかに異なるHadoopのバージョンで)ではなく、EMR上でローカルに実行されているように見えるん。

TSVファイルまたはAthenaに類似したコレクションフィールドをロードする方法はありますか?

答えて

1

現在、Athenaの現在のバージョン(2017年9月)は、フィールド名にタイプミスがあります。「colelction.delim」(referencerelevant fix)と呼ばれています。

修正がリリースされるまで、タイプミスを使用すると、仕事ん:問題が解決したとして、しかし、喜んで(より良い答えを受け入れる可能な場合

WITH SERDEPROPERTIES (
'serialization.format' = '|', 
'field.delim' = '|', 
'colelction.delim' = ',', 
'mapkey.delim' = '@' 
+0

インターネットでその上はほとんどの情報は、自身の答えを受け入れます例えば、入力ミスが修正された後でも動作するウォークアラウンドなど) – etov

関連する問題