Microsoft Azure HDInsights Hadoop ClusterのOracleデータベースからHiveスキーマにデータを直接ロードするSQOOPジョブがあります。しかし、のフィールド(varchar変数など)をインポートすると、これらが文字列としてインポートされることがわかりました。これは何も間違っていないし、それは私のために完全に動作します。ただし、Hive Databaseの文字列フィールドには、そのフィールドの最大長を使用するという小さな不便さがあります。これは、そのフィールドで条件を実行するたびにTRIM関数を使用することを意味します。 TRIMを使用しないSQOOPパラメータまたは回避策はありますか?TRIM機能を持たないSQOOPインポートテーブルを使用できますか?
敬具
私はすでにそれに見てきましたが、私は+でデータベースをインポートしていて、テーブルの名前を指定する上でもう少しとらわれないことが必要 - 200のテーブル。したがって、私は特に列を指定しないことを好むでしょう。この意味で、あなたはそれができると思いますか? –
Sqoopはこれ以外の機能は持っていませんが、ソースからHiveにデータ型をマッピングできるカスタム開発によって解決できます。 –
ありがとう、とにかく;) –