私はApacheテーブルにDBテーブルをインポートしたところで問題を解決しています。Apache Sparkのデータフレームのメジアン値を見つけるには
私はそれをDataFrameに変換しました。次に、RegisterTempTableを実行して、ハイブクエリを使用できるようにしました。
私はAmount
と呼ばれるフィールドの中央値を見つけることができませんよしかし
sqlContext.sql("select avg(Amount) from Table1001").show
、などの他の数学演算を実行することができますよ。このDataFrameの中央値を見つける方法はありますか?
適切に適切な溶液を用意してください。
あなたはどのように見つけるかを使用することができます中央値?ステップ1 - ソート。ステップ2 - 中央の要素を選択します。 –
[Apache Sparkで正確な中央値を計算するにはどうすればよいですか?](https://stackoverflow.com/questions/28158729/how-can-i-calculate-exact-median-with-apache-spark) – philantrovert
可能な重複[スパークを使用したメジアンとクオンタイルの検索方法](https://stackoverflow.com/questions/31432843/how-to-find-median-and-quantiles-using-spark) – user8371915