binning

    0

    1答えて

    特定の列の値も考慮に入れた最小サンプルサイズのビンを作成する方法を理解しようとしています。 したがって、以下のダミーデータでは、最小サンプル数6のビンを作成したいと思いますが、ビンに特定の値の列が含まれている場合は、同じ値を持つ他のすべての行。私はまた、どのビンにもa行の1つのユニークな値しか入れないことを望んでいます。次に、出力に列aの一意の値の平均、列bのすべての値の平均、およびサンプルサイズ

    1

    2答えて

    にZ値が私は例えば x y z 3.1 5.2 1.3 4.2 2.3 9.3 5.6 9.8 3.5 などを意味するペアx,yに関連zポイントのリストを持っています。私は次のような意味でのビン私のデータを、したい 10000の周りz値の合計数は、比較的高いです: 1)私が作るように、細胞内にxとy値を分割したいですx,yの2次元グリッド。x軸のセルが

    1

    1答えて

    私は2つの浮動小数点型の数の比率のデータセットを持っています。値によっては、無限大(ゼロで割る)の状況でinfの値があります。 pd.qcut/pd.cutとinfの値を使用するにはどうすればよいですか? 私のデータはhereにアクセスできます。 q = pd.qcut(df['ratio'], 10) ValueError: Bin edges must be unique: array([

    -1

    1答えて

    データフレームは、「収益」が数値、A、B、C、D、E ...がバイナリベクトルです。 A、B、C .... 1000columnsうち Earning A B C D E ...**1000 such binary vector columns** 21 1 0 0 1 1 45 0 0 0 1 1 67 0 0 0 1 1 23 0 0 0 0 1

    0

    1答えて

    1つのテーブルを使用してビンを作成し、別のテーブルに適用したいとします。私はこれをした: library(data.table) library(Hmisc) # for cut2 # (1) Make two data.tables A and B a <- sample(10:100, 10000, replace=TRUE) b <- sample(10:90, 10000, re

    1

    1答えて

    私はMATLABコードを最適化しようとしています。私のコードでは、forループの百万を超えるベクトルの機能をhistcountsが使用する必要があります。私がしたいのはhistcountsの代わりにhistcountsmexを直接使うことです。誰もそれを行う方法を提案することはできますか? これは私の関数である: function th = sndmode(mh) % this func

    2

    1答えて

    私はN個の要素の配列(ソートされていない)を持っています。私はNの元の順序を維持したいと思いますが、実際の要素の代わりに、Nにはビン番号を持たせたいと思います。ここでNはmビンに等しく分割されます(Nがmで割り切れる場合) (Nで割り切れないN)値。私はベクトル化された解を必要とします(Nはかなり大きいので、標準的なPythonの方法は効率的ではありません)。これを行うことができるscipyまたは

    5

    2答えて

    私はnumpyを使用して2番目の軸でビンしたい大きな2次元配列arrを持っています。 np.histogramは配列を平坦化するので、私は現在、forループを使用しています: import numpy as np arr = np.random.randn(100, 100) nbins = 10 binned = np.empty((arr.shape[0], nbins)) fo

    2

    2答えて

    Rのhist(x, breaks=XXX, plot=FALSE)$count関数のより高速な代替策を探しています。他の出力は必要ありません。 sapply呼び出しで使用します。この関数が呼び出される回数は100万回です)。 x = runif(100000000, 2.5, 2.6) bincounts = hist(x, breaks=seq(0,3,length.out=100), plo

    -5

    1答えて

    この質問は、matlabを使用してデータをビニングすることについてです。私は2つのデータセットを持っています。 1つのデータセットでは、私はbininして平均std、edgeとhの値を計算したx(速度を表す)とy(電力を表す)値を持っています。 (ここではコードではこれは新しいデータです)、それらが属する特定のビン(ここでは、私はすべてここで与えられたコードで計算されます)。下のコードでは、new