2017-01-10 5 views
0

データは、私がデータに応じてマップするためにテーブルを作成しました。しかし、以下のこのデータの上にテーブルを作成するには?

のように始まる新しいラインキーがあるまでデータが一定である。このデータの上に
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 

以下のようになります。

新ライン:このため、テーブルやスキーマを作成する方法

name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
SIA:uewi||Age:30||Place:Ohio||Qtype:Jame/tyler/on.txt/||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
SIA:uewi||Age:30||Place:Ohio||Qtype:Jame/tyler/on.txt/||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 
name:Jack Reacher||Age:30||Place:Ohio||ID:43730||inorg:abcd office||file:qwertyu/werty/ghj/dfhj.jpg 

?私はテーブルを介してマップ文字列を試してみましたが、それはうまくいきませんでした。

どのデリミタを使用してテーブルを作成し、そのデータのキー値を取得するか教えてください。

私はあなたが指定したフォーマットは、カテゴリ以下のいずれにも該当しないとして、カスタム形式SERDEを記述する必要が

Create table dataset (
    name string, 
    SIA string, 
    Age string, 
    Place string, 
    Qtype string, 
    ID string, 
    inorg string, 
    file string 
) ROW SEPERATED BY '||' stored as textfile; 

答えて

0

を試してみました。

Avro (Hive 0.9.1 and later) 
ORC (Hive 0.11 and later) 
RegEx 
Thrift 
Parquet (Hive 0.13 and later) 
CSV (Hive 0.14 and later) 
JsonSerDe (Hive 0.12 and later in hcatalog-core) 

いずれかのデータファイルを修正してrepalceする必要があります。で、それはJSON行い、その後JsonSerDe

を使用するか、RegEx

+0

ねえ、私は外部表(名前マップを作成してみましたasloてきた<文字列、文字列>区切り文字列、SIAマップ<文字列、文字列>デリミタを試してみてください文字列、 – RHarsha

+0

これまでに外部テーブルやテーブルを使用していたのですが、データが標準形式でないため、SERDEが必要です.. –

+0

可能な解決策はありませんか? – RHarsha

関連する問題