0
データフレームを読み込み、条件 "private == 1"(spark 2.1を使用)に基づいて読みたい。私は達成するための方法はありますsparkRに私はpysparkで `filter()`の列を指定するのにぎこちない方法
data = read.parquet(if_name) %>% filter(column("private") == 1)
のような一時的なtmp
データフレームなしでワンライナーとしてこれを行うことができます、しかし、私は2つのラインでそれを行うことができます
tmp = spark.read.parquet(if_name)
data = tmp.filter(tmp.private == 1)
のようなものを知っていますpysparkで同じです(関数[Cc]olumn
は未定義です)?