1
はなぜ列1st_from_end
はNULLを含まない:pysparkを使用してリストから最後の項目を取得するにはどうすればよいですか?
from pyspark.sql.functions import split
df = sqlContext.createDataFrame([('a b c d',)], ['s',])
df.select( split(df.s, ' ')[0].alias('0th'),
split(df.s, ' ')[3].alias('3rd'),
split(df.s, ' ')[-1].alias('1st_from_end')
).show()
私は[-1]
を使用すると、リスト内の最後の項目を取得するためのニシキヘビの方法だと思いました。どのようにそれはpysparkで動作しませんか?
おかげで、私の疑念を確認します。私の解決策はそれより少し面倒だった: 'reverse(split(reverse(df.s)、 '')[0])' – jamiet