1
私の研究は行っても、これについて何も見つかりませんでした。私はこのように、スパークデータフレームに簡単なpandas.DataFrame
を変換したい:PysasarkでPandas DataframeをSpark Dataframeに変換するTypeError
df = pd.DataFrame({'col1': ['a', 'b', 'c'], 'col2': [1, 2, 3]})
sc_sql.createDataFrame(df, schema=df.columns.tolist())
私が手にエラーがある:
df = pd.DataFrame([1, 2, 3])
sc_sql.createDataFrame(df)
と私:
TypeError: Can not infer schema for type: <class 'str'>
は私がさらに簡単に何かを試してみました取得:
TypeError: Can not infer schema for type: <class 'numpy.int64'>
助けてください?手動でスキーマなどを指定する必要がありますか?
sc_sql
はです。私はpython 3.4とspark 1.6のjupyterノートにあります。
ありがとうございます!
私はコードが正常に動作しようとしましたが、エラーはありません。 – shivsn
スキーマの有無にかかわらず、私にとっては... – neocortex
スパークバージョンは使用していますか? – shivsn