4
を持っていない私が使用してCSVファイルを読み込むことでデータフレームのオブジェクトを作成するためにpyspark 2.0を使用しています:pysparkエラー:「DATAFRAME」オブジェクトが属性「マップ」
data = spark.read.csv('data.csv', header=True)
私は
を使用してデータの種類を見つけますtype(data)
結果は、私がclassifを適用するためにLabeledPointにデータ内の一部の列を変換しようとしています
pyspark.sql.dataframe.DataFrame
ですication。
from pyspark.sql.types import *
from pyspark.sql.functions import loc
from pyspark.mllib.regression import LabeledPoint
data.select(['label','features']).
map(lambda row:LabeledPoint(row.label, row.features))
私はこの問題に出くわした:
AttributeError: 'DataFrame' object has no attribute 'map'
エラー上の任意のアイデアを?分類を実行するためにDataFrameからLabelPointを生成する方法はありますか?
で削除されましたが、これはその問題を解決し、ありがとうございます! –