0
AWS S3バケットにXMLファイルが格納されています。 XMLメタデータを抽出し、HDFSのHIVEテーブルにロードしたいと考えています。この活動を促進するのに役立つツールはありますか?ハイブを使用してS3 XMLファイルクエリを読み取る方法
AWS S3バケットにXMLファイルが格納されています。 XMLメタデータを抽出し、HDFSのHIVEテーブルにロードしたいと考えています。この活動を促進するのに役立つツールはありますか?ハイブを使用してS3 XMLファイルクエリを読み取る方法
さて、HIVE XML SerDeを使用してXMLファイルを読んだり、XMLを理解できるカスタムUDFを書いたり使用したりする必要があるかもしれません。
役立つかもしれないいくつかの参照:hivexmlserde-1.0.5.3.jarの助けを借りてhttps://community.hortonworks.com/articles/972/hive-and-xml-pasring.html https://github.com/dvasilen/Hive-XML-SerDe/wiki/XML-data-sources https://community.hortonworks.com/questions/47840/how-do-i-do-xml-string-parsing-in-hive.html
は、XMLからデータを抽出するために管理しました。 –
素晴らしい@パワン! –