2017-05-28 2 views
0

textfile形式では、データはフィールド区切り文字で区切られたフィールドを含むテキスト形式で格納されます。そのため、我々はCTRL^Aのような非可読区切りを好む理由です。フィールド区切り文字はHiveのバイナリファイル形式で重要ですか?

しかしrcfileにハイブテーブルを作成しながら、フィールド区切り文字を使用して、任意の効果があり、orcavro & sequencefile

ハイブのチュートリアルでは、これらのバイナリファイル形式でもデリミタの使用を見ていました。

例:

create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile;

フィールド区切り文字は無視されるか、またはそれはハイブでバイナリファイル形式に重要ですか?

答えて

0

RCFILE、ORCおよびAVROによって無視されますが、SEQUENCEFILEについては問題ありません。

関連する問題