1
SASのような異なるマクロセットに対して同じコードを繰り返し、すべてのテーブルを一緒に読み込むようにしたい。私はsasの背景から来ているので、私はPyspark環境でこれを行う方法についてかなり混乱しています。どんな助けでも大歓迎です!SASのようにpysparkでマクロをループする方法はありますか?
例コードは以下である:
STEP1は:マクロ変数
lastyear_st=201615
lastyear_end=201622
thisyear_st=201715
thisyear_end=201722
STEP2定義:ループ様々なマクロ変数
介してコードをcustomer_spend=sqlContext.sql("""
select a.customer_code,
sum(case when a.week_id between %d and %d then a.spend else 0 end) as spend
from tableA
group by a.card_code
"""
%(lastyear_st,lastyear_end)
(thisyear_st,thisyear_end))
こんにちはプッシュクル、ありがとう。リスト内で文字列値を使用することはできますか?つまり、[['a'、 'b'、 'c']、[1,2、 'x]]などのようになりますか? –
はい、あなたも文字列を使うことができます – Pushkr
私はまた、配列から別々にマクロ変数を定義し、配列内でそれを参照することもできます:a = "" "費やし> 0、1 else else end" "[[a 、1,2]、[a、2,4]] –