2016-09-08 8 views
4

を持っていない私が使用してCSVファイルを読み込むことでデータフレームのオブジェクトを作成するためにpyspark 2.0を使用しています:pysparkエラー:「DATAFRAME」オブジェクトが属性「マップ」

data = spark.read.csv('data.csv', header=True) 

私は

を使用してデータの種類を見つけます
type(data) 

結果は、私がclassifを適用するためにLabeledPointにデータ内の一部の列を変換しようとしています

pyspark.sql.dataframe.DataFrame 

ですication。

from pyspark.sql.types import *  
from pyspark.sql.functions import loc 
from pyspark.mllib.regression import LabeledPoint 

data.select(['label','features']). 
       map(lambda row:LabeledPoint(row.label, row.features)) 

私はこの問題に出くわした:

AttributeError: 'DataFrame' object has no attribute 'map' 

エラー上の任意のアイデアを?分類を実行するためにDataFrameからLabelPointを生成する方法はありますか?

答えて

14

使用.rdd.map

>>> data.select(...).rdd.map(...) 

DataFrame.mapがスパーク2.

+1

で削除されましたが、これはその問題を解決し、ありがとうございます! –

関連する問題