2017-02-07 5 views
1

データ型が混在しています。 spark.sql('select a,b,c from table')コマンドを使用して、このデータフレームをハイブテーブルから読み取っています。データフレームのすべての列を文字列にキャストする方法

一部の列はint、bigint、doubleなどの文字列です。合計で32の列があります。 pysparkにデータフレームのすべての列を文字列型に変換する方法はありますか?ただ、

答えて

7

from pyspark.sql.functions import col 

table = spark.sql("table") 

table.select([col(c).cast("string") for c in table.columns]) 
関連する問題