DSXでのSparkSession DataFrameのインポート

現在、私はData Science Experienceで作業しており、CSVファイルをSparkSession DataFrameとしてインポートしたいと考えています。私は正常にDataFrameをインポートすることができますが、すべての列の属性は文字列型に変換されます。このDSX機能でCSVファイルに存在するタイプをどのように認識させるのですか？DSXでのSparkSession DataFrameのインポート

出典

2017-06-08 Josh

現在は、pyspark.sql.DataFrameの実際の作成のために生成されたコードは次のようになります。

次のオプションを追加する必要が

df_data_1 = spark.read\ 
    .format('org.apache.spark.sql.execution.datasources.csv.CSVFileFormat')\ 
    .option('header', 'true')\ 
    .load('swift://container_name.' + name + '/test.csv') 
df_data_1.take(5)

、スキーマが推測されます：

.option(inferschema='true')\

出典

2017-06-08 19:00:08

DSXでのSparkSession DataFrameのインポート

答えて

関連する問題