この機能を使用すると、値0,1,2,3、...が返されるか、Dataframeで使用するときに巨大な値が返されます。それがなぜそうであるかは不明です。私は値が生成されているかどうかを制御できません。 source codeでコメントからMonotonicallyIncreasingIdの出力変数が広く
答えて
:
現在の実装では、上位31ビット、 にパーティションIDを置き、下位33ビットは、各 パーティション内のレコード数を表します。データフレームには1個のパーティションがあり、各パーティションには80億個未満のレコードが含まれていると仮定しています( )。
パーティション0の値が低くなり、他のすべてのパーティションの値が非常に高くなります。
しかし、これはあなたが依存してはならない実装の詳細です。単調に増加する性質だけが同じままであることが保証される。
これはmonotonicallyIncreasingId()
単調64ビット 整数を増加生成列発現のためfunction DOCには明らかです。生成されたIDは単調に増加することが保証されます。 は増加し、ユニークですが連続しません。現在の実装 は、パーティションIDを上位31ビットに、レコード番号 を下位33ビットの各パーティション内に配置します。データフレームが のデータフレームには10億未満のパーティションがあり、各パーティションには 未満の80億レコードがあると仮定しています。
例として、の場合、3つのパーティションがあり、それぞれに3つの レコードがあるDataFrameがあるとします。この式は、以下のIDを返します:0、1、2、 8589934592(1L < < 33)、8589934593、8589934594.
は、この情報がお役に立てば幸い!
あなたの努力のためにもthx – thebluephantom
- 1. 出力が一意である場合の変数の出力
- 2. hrefの出力変数 - Javascript
- 3. 変数wgetのコンソール出力
- 4. サブプロセスの出力を変数
- 5. VHDLバッファ変数と出力変数
- 6. Talend - 1行から多くの可変数の出力行
- 7. 関数が変数出力番号を呼び出す
- 8. プロローグ変数出力Generic
- 9. 保存ループ出力変数
- 10. シェルコマンドで変数を出力
- 11. 変数出力の中にPHPコードを書く方法は?
- 12. Javascript変数は未定義ですが、警告出力変数
- 13. Wordpressのcomments.phpの変更PHPの出力変数が真
- 14. 出力が変化
- 15. 変数を広く利用できるDjangoのオプション
- 16. ルビーのhtmlからの出力を変数に出力
- 17. バッチで変数へのコマンド出力を入力してください
- 18. Writerowがcsvファイルにいくつかの変数を出力しない
- 19. ループ外の出力変数をForeachで出力する
- 20. 複数の変数が1行に出力されない
- 21. ローカル変数が別の関数に出力されます
- 22. fortranプログラムの変数への出力
- 23. 変数へのRails出力の保存
- 24. 変数のシェルコマンドループとファイルへの出力
- 25. Eclipseのデバッグ変数のエクスポート/出力
- 26. PHPUnit - 変数へのBashスクリプトの出力
- 27. 可変数の入出力のVHDL
- 28. 変数へのBashスクリプトストアコマンドの出力
- 29. スクリプトの出力変数の展開
- 30. os.environ変数の出力に関して
実際にはあまり役に立ちません。 – thebluephantom