uwenku
タグリスト
parquet
5
熱
2
答えて
寄木細工と分割によるスパークデータフレーム
私はこのトピックに関する多くの情報を見つけることができませんでしたが、データフレームを使用して寄木張りファイルを読み込み、10ブロックスパークは自然に10パーティションを作成します。しかし、データフレームがファイルを読み込んで処理するときには、大きなデータ対パーティション比を処理しません。なぜなら、ファイルを圧縮解除して処理すると、ブロックサイズが大きくなり、パーティションも大きくなるからです。
apache-spark
apache-spark-sql
parquet
2015-09-15
13
熱
1
答えて
パレットメタデータファイルをロールバックする必要がありますか?
寄せ木ファイルdataは、そのdate列に分割して書き込まれた場合、我々は同じようなディレクトリ構造を取得:パーティションdate=2はなど、シェルまたはファイルブラウザ経由(寄せ木ユーティリティの関与なしに削除された場合 /data _common_metadata _metadata _SUCCESS /date=1 part-r-xxx.g
apache-spark
spark-streaming
parquet
2015-10-04
«
20
21
22
23
24
25
26
27
28
»
最新の質問
1.
Grailsコマンドオブジェクトモデルと同じURL /ページを持つリダイレクト
2.
FFMPEGオーディオと画像をMP4に表示 - 画像が表示されない
3.
wordpressで正しいスタイルのstyle.cssを追加する
4.
<a href="#id"> to a javascript
5.
説明できないローカル変数が初期化されていない可能性があります。
6.
ネストしているヌル集合演算子(??)はどのようにPHPで動作しますか?ステップ・バイ・ステップが必要実行フロー
7.
ubuntuのhttpdocsにインストール
8.
Mongoose ORM async await
9.
Sentinel Activationを無効にする方法(Laravelを使用)
10.
HTTP要求を介してUnity C#で外部API(IBM Watson)を呼び出せませんか?