SparkにtakeSample()
関数を使用しようとしています。パラメータは - のデータ、取るサンプル数およびシードです。しかし、私は種子を使いたくない。毎回違う答えをしたい。私はそれをどうやってできるのか理解できません。私はSystem.nanoTime
をシード値として使用しようとしましたが、データ型が一致しなかったと考えてエラーが発生しました。シードなしで使用できるtakeSample()
に類似した他の機能はありますか?または、私がtakeSample()
と一緒に使うことができる他の実装があるので、毎回異なる出力が得られます。sparkのtakeSample()関数
6
A
答えて
7
System.nanoTime
は、タイプlong
であり、takeSample
によって予想される種は、タイプInt
である。したがって、takeSample(..., System.nanoTime.toInt)
が動作するはずです。
1
System.nanoTime
はlongを返しますが、takeSampleはIntを想定しています。
scala.util.Random.nextInt
を、シード値としてtakeSample関数に渡すことができます。
1
Sparkバージョン1.0.0以降、seed
パラメータはオプションです。 https://issues.apache.org/jira/browse/SPARK-1438を参照してください。
関連する問題
- 1. Spark :: KMeansはtakeSample()を2回呼び出しますか?
- 2. Spark dataframe explode関数
- 3. ReduceByKey関数 - Spark Python
- 4. Apache Sparkのlookup()関数
- 5. Sparkビルドカスタム列関数、ユーザ定義関数
- 6. sparkデータセットto_date/year関数
- 7. ScalaとSpark UDF関数
- 8. Apache Sparkカスタム集約関数
- 9. ウィンドウ関数/ scala/spark 1.6
- 10. Apache Spark 2.0 - date_add関数
- 11. Spark GroupBy集計関数
- 12. 関数内の 'Column'オブジェクトの動作spark
- 13. spark sql現在のタイムスタンプ関数
- 14. SparkクラスタのRDDマップ関数内で関数を呼び出す
- 15. Sparkでウィンドウ関数を使用する
- 16. データを複製するspark - sample()関数?
- 17. Spark Hive - ウィンドウ関数を持つUDFArgumentTypeException?
- 18. sparkでOrderedRDD関数を使用する
- 19. Spark dense_rankウィンドウ関数 - partitionBy節なし
- 20. ScalaとSparkでの複数の関数の並列実行
- 21. Postgres関数をImpala UDFまたはSparkの関数に変換する
- 22. スパークジョブが無期限にrddでハングするtakeSample
- 23. Spark Streamingマッピング関数で変数をブロードキャストする方法は?
- 24. pysparkのマップ関数によってsparkのsqlデータフレームの数を数えます。
- 25. Spark DStreamのforeachDD関数でのRDDでの同時変換
- 26. Sparkのcsvの単一の列に関数を適用する
- 27. Spark Dataframe:マップ関数の次のレコードへのアクセス
- 28. デルタデータのSpark Dataframeのウィンドウ関数row_numberカラムの更新
- 29. sparkのreduceByKeyAndWindow関数の奇妙な動作
- 30. sparkの変換とrdd関数の違いは何ですか?
スカラーの '.toInt'は' .intValue'より優先すべきです –
@RégisJean-Gillesありがとう、訂正しました。 –