2016-10-27 7 views
2

このコードは、与えられたリストからデータフレームを作成しています:createDataFrameでsqlContext.createDataFrame()の引数は何ですか?

sample_one = [(0, 'mouse'), (1, 'black')] 
sample_two = [(0, 'cat'), (1, 'tabby'), (2, 'mouse')] 
sample_three = [(0, 'bear'), (1, 'black'), (2, 'salmon')] 
sample_data_df = sqlContext.createDataFrame([(sample_one,), (sample_two,),(sample_three,)], ['features']) 

()、余分なコンマがsample_one(sample_one、)の後に与えられているのはなぜ?

答えて

1

この構文はタプルを作成するためのものです。次のように試すことができます:

>>> sample_one = [(0, 'mouse'), (1, 'black')] 
>>> type((sample_one)) 
<type 'list'> 
>>> type((sample_one,)) 
<type 'tuple'> 
+0

@ Anthony..Thanks ...これは、データフレームを作成するためのタプルのリストを与える必要があるためです。 – Neo

関連する問題