XMLファイルをハイブテーブルにロードしようとしています。以下は私のハイブテーブルのクエリです。XMLデータをハイブテーブルにロード中にエラーが発生しました
CREATE TABLE MYDATA(NAME STRING, AGE INT, SEX STRING)
ROW FORMAT SERDE 'com.ibm.spss.hive.serde2.xml.XmlSerDe'
WITH SERDEPROPERTIES(
"column.xpath.NAME"="/TAG/NAME/text()",
"column.xpath.AGE"="/TAG/AGE/int()",
"column.xpath.SEX"="/TAG/SEX/text()")
STORED AS INPUTFORMAT 'com.ibm.spss.hive.serde2.xml.XmlInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.IgnoreKeyTextOutputFormat'
LOCATION '/home/sid/hivexmltab'
TBLPROPERTIES("xmlinput.start"="<TAG","xmlinput.end"="</TAG>");
私の入力ファイルは、以下の形式である:
<TAG>
<NAME>ABCD</NAME><AGE>25</AGE><SEX>male</SEX>
<NAME>EFGH</NAME><AGE>23</AGE><SEX>female</SEX>
</TAG>
私は以下のような出力を見てみたい:
ABCD,25,male
EFGH,23,female
しかし、イムは、以下のような出力を得る:
<string>ABCDEFGH</string> NULL <string>malefemale</string>
jaファイルを使用しています:hivex mlserde-1.0.5.3.jar for Xml SerDe
ここでエラーが発生しているのは誰ですか? 何か助けていただければ幸いです。
その働き。 xmlファイルを読み込むための適切なテーブル構造の構築に本当に助けになりました。 – Sidhartha