blaze

    2

    1答えて

    私は公式ウェブからtutoralによると、私は厳格な、JSONファイルの語数30ギガバイトのためDASKバッグを使用しようとしている:、http://dask.pydata.org/en/latest/examples/bag-word-count-hdfs.html しかし、まだ動作していない私のシングルマシンは32GBのメモリと8コアのCPUです。 以下のコードは、10GBファイルの処理にも使

    0

    1答えて

    すべて、 hive2トランプサーバーからデータを読み込もうとしています。私はhereと似た分析をしたいと思います。ここに私の現在のプロセスがあります。 import blaze as bz import sqlalchemy import impala conn = connect(host='myhost.url.com', port=10000, database='mydb', us

    0

    1答えて

    Blazeを使用しているSQLのような簡単な操作を実行しようとしています。フィルタリング操作で操作ごとに連鎖すると、Blazeは2つのコマンドを適切に連鎖させません。 sqliteの中でこのデータを使用して : index customer item quantity 0 0 Greg Apples 5.0 1 1 Greg Soup NaN 2 2 Susan Pears

    0

    1答えて

    everyone。私はいくつかのファイルを処理するために分散+ HDFSでDaskを使用しようとしています。私はHDFS3プラグインをインストールするには、分散試みをインストールしたときに、エラーが発生した: Can not find the shared library:libhdfs3.so 私の環境はUbuntuの16のデスクトップバージョンです。私はbewloによると厳しいが、まだ動作して

    0

    1答えて

    私は巨大なデータセット(〜2000万レコードと10個の列)でPythonを使用した探索的なデータ分析に取り組んでいます。私はセグメント化し、データを集約し、いくつかの視覚化を作成するだろう、私はそのデータセットを使用していくつかの決定木線の回帰モデルを作成するかもしれない。 大量のデータセットがあるため、コアデータを格納できないデータフレームを使用する必要があります。私はPythonには比較的新し

    0

    1答えて

    別の列名を使用してテーブルを作成しようとすると、 ? テーブルを削除した後、テーブルが消えたことをSQLiteエクスプローラで確認できます。 ODOを介して新しいファイルをロードしようとすると、「着信データの列名がSQLテーブルの既存のSQLテーブル名の列名と一致しません」というエラーが返されます。以前にドロップされたスキーマを使用して、同じテーブルがデータベースに再作成されていることがわかりまし

    0

    1答えて

    2つのデータソース、1つのpostgreSQLテーブル、1つのCSVファイルをマウントするブレーズサーバーを実行したいのですが、どのようにblazeサーバーに複数のデータソースをマウントできますか。 私は、サーバー側で、次のコードを持っている: engine = create_engine('postgresql://user:[email protected]:5432/mydb') with

    0

    1答えて

    odoのドキュメントは非常にまばらですが、csvファイルの読み込み時などにパラメータを渡す方法については説明していません。たとえば、ファイルにlatin1がエンコードされていることをodoに伝えるにはどうすればよいですか? data=[] odo('mylatin1.csv',data)

    3

    1答えて

    私はそれをロードするために私が火を使用した〜7400000行を持っているデータテーブルがあります。 from blaze import CSV, data csv = CSV('train.csv') t = data(csv) これはフィールドこれらを持っている:これは、このような大きいデータフレーム、特定の基準に適合するどうすれば効率的に出力列であるので、A、B、C、D、E、F、G か

    0

    1答えて

    私はJupyter Notebookであるデータコンシューマを持っています。 blazeで書かれたクエリーをgraphQLクエリーに翻訳する方法はありますか? accounts[accounts.balance < 0].name をしてGraphQLに我々はこれを持っているかもしれません: 炎で例えば我々が持っている { accounts(balance<0) { name } }