私は10フィールドのデータセットを持っています。これらのDataFrameでRDD操作を実行する必要があります。 データフレームでRDD演算を実行
がここ
...map
、
flatMap
、などのようなRDD操作を実行することが可能であることは私のサンプルコードは次のとおりです。
df.select("COUNTY","VEHICLES").show();
これは私のdataframe
であると私は、このdataframe
がRDD
に変換して、いくつかのRDD操作を操作する必要がありますこの新しいRDDでここ
コードiはRDDに変換した後RDD
RDD<Row> java = df.select("COUNTY","VEHICLES").rdd();
に変換データフレーム午前方法であり、iはRDDの結果を見ることができないです、私は上記のすべての場合において
java.collect();
java.take(10);
java.foreach();
を試みI結果を得ることができませんでした。
私を助けてください。
「df.select( "COUNTY"、 "VEHICLES")についてrdd.collect() 'とは何ですか? – mtoto
多くの場合、多くの場合、mapframe/flatMapの複雑な構文を使用する代わりに、dataframeの 'withColumn'メソッドを使用すると、これらのアクションの多くをより簡単に実行できます。おそらく実際に何をしようとしているかの例を示し、実際のデータセットを提供するべきでしょう。 –
@mtotoはすべてを単一のノードに入れるわけではありませんか? –