bigdata

    0

    1答えて

    elasticsearchで更新するデータは6kkです。そして私はPHPを使用する必要があります。 ドキュメントで検索したところ、Bulk Indexingが見つかりましたが、以前のデータは保持されていません。 は私が持っている:更新する [ { 'name': 'Jonatahn', 'age' : 21 } ] マイコード: $params =[

    0

    1答えて

    私はApache Flinkチュートリアルに従ってTaxiRideイベントのストリームを整理しています。結果のストリームはコンソールに出力されます。そして今、私はcsvファイルに書きたいと思います。私はそれはコンパイルエラーにつながるDataSet<Tuple1<TaxiRide>> rides1 = filteredRides.writeAsCsv("/resources").setParall

    0

    1答えて

    パーティションを変更するようなハイブでテーブルを変更するとき。テーブルに何が起こるか。テーブルを再フォーマットするか、新しいパーティション用の新しいデータを作成しますか?

    0

    1答えて

    データセットがメモリに収まらないほど大きすぎるので、モデルをバッチでトレーニングする必要があります。私はGridSearchCV、RandomizedSearchCV、またはBayesSearchCV(scikit-optimizeから)でモデルをラップし、私の巨大なデータセットのさまざまな部分でこれらの複数のインスタンスを訓練することができず、それぞれが見いだした最良のハイパーパラメータを期待し

    -1

    2答えて

    私は数百万の非常に小さなファイルを含んでいるアプリケーションを扱っています。転送するのは非常に難しいです。 私は大きなファイルを作成する可能性のあるbi​​gfilesまたは別の仮想ファイルシステムを考え、インデックスされたすべてのデータを含んでいます。 ゴーランではどうしたらいいですか?お勧めのお勧めはありますか?

    0

    0答えて

    これで何も見つかりませんでしたので、ここで私の質問が答えを見つけることを願っています。設定 問題: すべてはブルームフィルタで採掘を高揚するために属します。 は私が今までどの段階でどのような場合にはMに達しない場合Nのために、いくつかの最大容量Mと各フィルタN. 内の項目の金額をブルームフィルタの数千を持っています。 偽陽性Pの 確率 - 0.001%私は漸進5つのインクリメンタル交差点を±して、

    0

    1答えて

    私はスパークストリーミングジョブを実行しており、ストリーミング入力は3時間ごとに約50MBです。ジョブは最初の数時間で少数のファイルを処理しました。しかし突然、次のエラーで失敗しました。エラーが発生した場合、入力は受信されませんでした。スパークジョブが新しい​​スレッドを作成できませんでした。 私はビジネスロジックのRDDをキャッシュしていますが、新しいスレッドが新しい入力ファイルごとに作成される

    0

    2答えて

    私はスタンドアロンモードでスパークを実行しています(私たちのシステムには今後配布される予定です)。まず、このファイルをFTPからローカルのe.g c:\spark\analysis\bigfile.txtにコピーする必要があります。そのファイルを解析用のスパークで読み込むことができます。 私の質問は、どのようにメモリを使い果たすことなく効率的に大きなファイルをコピーできますか? スパークすることは

    1

    1答えて

    で一部の列を返します。私はデータがマップ専用のジョブ出力から得たので、外部のハイブテーブルを作成しました。次に、特定のファイルのパスを指定してコマンドをロードします。それは大丈夫だった。しかし、私がselect * from tableコマンドを実行すると、null値を持つ列が返されます。私が実行した各コマンドは、エラーpicにあります。ファイル内 私の区切り文字は||あるので、私はあまりにもta

    0

    1答えて

    Azureのr HDinsightサーバに関しては、主に32コアの4ノードで構成されています。 ここに設定のスクリーンショットがあります。 しかし、私はRスタジオ・インターフェースでsshuserで接続し、私は彼が私にだけ4つのコアを返すコマンド detectCores (all.tests = FALSE, logical = TRUE) を使用する場合? ! どうかありがとうございますか?