2016-05-27 17 views
0

I持って次のコード:pyspark:タイプオブジェクトの行 'には属性を持っていない 'fromSeq'

from pyspark.sql import Row 
z1=["001",1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,30,41,42,43] 
print z1 
r1 = Row.fromSeq(z1) 
print (r1) 

その後、私が得たエラー:

AttributeError       Traceback (most recent call last) 
<ipython-input-6-fa5cf7d26ed0> in <module>() 
     2 z1=["001",1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,30,41,42,43] 
     3 print z1 
----> 4 r1 = Row.fromSeq(z1) 
     5 
     6 print (r1) 

AttributeError: type object 'Row' has no attribute 'fromSeq' 

誰もが私が見逃しているかもしれないものを知っていますか?ありがとう!

+0

正しいデータフレームを構築するために必要なものすべてである私が何をしたいことはhttps://spark.apache.orgだと思います/docs/1.4.0/api/java/org/apache/spark/sql/Row.html https://spark.apache.org/docs/1.5.2/api/python/pyspark.sql.html#pyspark .sql.Row –

+0

pysparkドキュメントではfromSeqの実装はありません –

+0

リストから行を作成するにはどうすればよいですか?配列は大きく、要素を1つずつ入力することはできません – Edamame

答えて

0

あなたは名前を提供しない場合は、単にtupleを使用します。

tuple(z1) 

これは

関連する問題