SparkSqlはハイブテーブルから浮動小数点型フィールド値を取得します

私はsqoopでハイブテーブルを作成しインポートし、pysparkを使用してデータを取得します。テーブルは、1つの文字列フィールド、1つのintフィールド、および複数のfloatフィールドで構成されます。私は色相ハイブSQLクエリによって全体のデータを取得することができます。しかし、私がpyspark sqlでプログラムしている間は、non-floatフィールドを表示することができ、floatフィールドは常にnull値を表示します。 HUEハイブSQL結果： SparkSqlはハイブテーブルから浮動小数点型フィールド値を取得します

ツェッペリンpyspark出力：

ハイブテーブルの詳細：

出典

2017-06-29 user1744585

は、私は最終的に原因を見つけました。 mysqlからsqoop経由でこれらのテーブルをインポートするからです。元のテーブルの列は大文字で、ハイブではすべて自動的に小文字に変換されます。変換されたすべてのフィールドの値がsparksqlで取り出すことができませんでした。（ただし、HUEハイブはこれらのデータを通常通り照会しますが、sparkのバグかもしれません）sqoopコマンドで--queryオプションを指定することで、大文字のフィールド名を小文字に変換する必要があります。つまり、--query 'MMMをmmmとしてテーブルから選択...'

出典

2017-07-18 09:50:50 user1744585

SparkSqlはハイブテーブルから浮動小数点型フィールド値を取得します

答えて

関連する問題