binning

    0

    1答えて

    オブジェクトのセット、特にxとyの値を持つポイントタイプをビンして、ポイントセットに存在する各x、yペアのポイント数を数えることができます。 xとyの最大値は[-1000,1000]なので、可能な点ごとにユニークなハッシュコードを生成するのは簡単です。 実際のビニングプロセスでは、ディクショナリを使用してこれを行うことができます。辞書にポイントを追加/検索するときにGetHashCodeが使用され

    4

    2答えて

    以前私はquestionにデータフレームから重複する行を抽出するように頼んだ。私は今これらの重複のどれを最終データセットに残すかを決定するスクリプトを実行する必要があります。 このデータセットの重複したエントリは、同じ「アッセイ」および「サンプル」値を持ちます。ここでは、新しいデータの最初の10行は、私の重複したエントリを含むでの作業イムを設定します: Assay Sample Genotype

    17

    4答えて

    をREBIN: http://star.pst.qub.ac.uk/idl/REBIN.html 整数係数平均化することによって、2Dアレイによってダウンサイジング。例えば :私は、関連するサンプルの平均を取ることによって、(2,3)にサイズを変更したい >>> a=np.arange(24).reshape((4,6)) >>> a array([[ 0, 1, 2, 3, 4, 5],

    2

    3答えて

    Iは16個のビンにアレイをデジタル化するために、次のコードを使用しています: numpy.digitize(array, bins=numpy.histogram(array, bins=16)[1]) 16個のビンがあるので、私は、[1]、[16]出力が範囲内にあることを期待します。ただし、返される配列の値の1つは17です。これはどのように説明できますか?

    1

    1答えて

    私は以前に持っていた値のベクトル内の隣接する値の間に定義された間隔の間にランダムに生成された数を "ビン"しようとしています。したがって、本質的には次のようになります。 101の値を101から0まで含むベクトルA xという乱数を生成します。さて、vectorAの中で互いに隣り合っている2つの数字の間の間隔を調べたいのですが?最後に、区間が見つかると、その2つの値を返します。 if文があります。 i

    11

    3答えて

    私は、2D numpy配列の数値ビニングを行うための高速なフォーミュレーションを探しています。ビニングとは、サブマトリックスの平均値または累積値を計算することです。例えば、 x = numpy.arange(16).reshape(4,4)は、それぞれ2x2の4つの部分行列で分割され、numpy.array([[2.5.4.5]、[10.5,12.5]))を与え、2.5 = numpyとなります。

    1

    2答えて

    私はn行とn列の行列を持ち、一度に平均10行のビニングを行いたいのです。つまり、最終的にサイズn/10の行列が残っています。 n。私はMatlabのライブラリを追加し、次のコードを試してみました: nRemove = rem(size(a,1),10); a = a(1:end-nRemove,:) Avg = mean(reshape(a,10,[],n)); AvgF = squeez