を私はスパークでPythonと協力し、その最初の数行です.csvファイルから私のデータセットを読んでいます:パイソン(pyspark)エラー=とValueError:float型に文字列を変換できませんでした:「17」
17 0.2 7
17 0.2 7
39 1.3 7
19 1 7
19 0 7
私はこのエラーを取得する
# Load and parse the data
def parsePoint(line):
values = [float(x) for x in line.replace(',', ' ').split(' ')]
return LabeledPoint(values[0], values[1:])
:
Traceback (most recent call last):
File "<stdin>", line 3, in parsePoint
ValueError: could not convert string to float: "17"
どれHEL私は以下のコードを持つファイルから一行ずつ読み込ん
pは大変感謝しています。
'.split( '')'ではなく '.split( '|')'を使用する必要があります。 – zondo
これらを '|'私の質問を掲示している間にセルの境界線を明確にする実際のファイルには存在しません。 –
ああ、空白があればそれができるはずです。あなたの質問にちょうどそれがファイルにどのようにテキストを置く。 – zondo