私はpyspark上のsparkコードの部分を実行してエラーを取得しようとしています。何が欠けているのか理解してもらえますか?spark-名前の最初の文字で名前を数える方法spark登録テーブル
p1 = pd.DataFrame(final_data,columns = ['Year','Name','Sex','Count'])
h1 = sqlContext.createDataFrame(p1)
h1.registerTempTable('namesdb')
sqlContext.sql("select SUBSTR(Name, 1, 1) as char1, count(Name) FROM namesdb group by char1 order by char1 ASC").toPandas()
しかし、私はエラーの下に取得しています:ここで
AnalysisException: u"cannot resolve 'char1' given input columns: [Year, Name, Sex, Count];
はfinal_data
final_data[:2]
[[1880, 'Mary', 'F', '7065'],
[1880, 'Anna', 'F', '2604']
グレート、感謝します君は !!それは働いている。 – ytasfeb15