私は非常に大きい疎な論理行列を持っています。ゼロ以外の要素を別のベクトルに格納せずに、ランダムな非ゼロ要素を描画したいと思います(たとえば、findコマンドを使用して)。これを行う簡単な方法はありますか?疎行列から無作為な非ゼロ要素を描く
現在、私は拒否サンプリングを実装しています。これは、ランダム要素を描画し、それが非ゼロであるかどうかをチェックしています。しかし、非ゼロ要素の比率が小さい場合は効率的ではありません。
私は非常に大きい疎な論理行列を持っています。ゼロ以外の要素を別のベクトルに格納せずに、ランダムな非ゼロ要素を描画したいと思います(たとえば、findコマンドを使用して)。これを行う簡単な方法はありますか?疎行列から無作為な非ゼロ要素を描く
現在、私は拒否サンプリングを実装しています。これは、ランダム要素を描画し、それが非ゼロであるかどうかをチェックしています。しかし、非ゼロ要素の比率が小さい場合は効率的ではありません。
findは、疎行列の非ゼロ要素を取得するための標準インタフェースです。 http://www.mathworks.se/help/techdoc/math/f6-9182.html#f6-13040
[i,j,s] = find(S)
ここを見て発見iは、ベクトルでベクトルjの列のインデックス、およびベクトルsでゼロ以外の値そのものを非ゼロ値の行インデックスを返します。
sを取得する必要はありません。 i、jでランダムなインデックスを選択するだけです。
おそらく私のポイントは十分に明確ではありませんでした。 findを使用したくないのは、インデックスを別のベクトル(例ではiとj)に格納しなければならないためです。これは非常にメモリを消費します。これを疎な論理行列である疎行列自体と比較する。 – user1210230
それははっきりしていましたが、他の方法はありません。 –
疎な論理行列は、ランダムな場所を選択したい場合、データをあまり実用的ではありません。拒否サンプリングとfind
は、私にとって意味をなさない唯一の2つの方法です。
%# using find
idx = find(S);
%# draw 4 without replacement
fourRandomIdx = idx(randperm(length(idx),4));
%# draw 4 with replacement
fourRandomIdx = idx(randi(1,length(idx),4));
%# get row, column values
[row,col] = ind2sub(size(S),fourRandomIdx);
%# using rejection sampling
density = nnz(S)/prod(size(S));
%# estimate how many samples you need to get at least 4 hits
%# and multiply by 2 (or 3)
n = ceil(1/(1-(1-density)^4)) * 2;
%# random indices w/ replacement
randIdx = randi(1,n,prod(size(S)));
%# identify the first four non-zero elements
[row,col] = find(S(randIdx),4,'first');
NNZ非ゼロ要素を持つn×mの行列が非ゼロの位置を保存するためにNNZ + N + 1の整数を必要とします。ここでは、それらを効率的に行うことができます方法です(あなたが4つのランダムな位置を取得したいと仮定した場合)エントリ。論理行列の場合、非ゼロのエントリの値を格納する必要はありません。これらはすべて真です。これに対応して、論理的な疎行列を、nnz + 2の整数の記憶域しか必要としないnとmと一緒に、非ゼロの項目の線形インデックスのリストに変換するのが最善です。これらの(およびind2sub)から、範囲外でランダムに選択した任意の非ゼロ項目に対応する添え字を簡単に再構成することができます。1.nnz
私のアプリケーションでは、ゼロエントリからのサンプリングも必要です。したがって、ランダムなエントリの値をチェックできるように、疎な行列を維持します。インデックス作成ソリューションでは、ゼロ要素のサンプリングは不可能です。 – user1210230
あなたの目標を明確にすることはできますか?あなたの元の投稿は、あなたが "ランダムな非ゼロ要素"を描きたいと言っていました。しかし、あなたのコメントでは、ゼロのエントリーからも引き出したいと思われます。明確にできますか?つまり、行列から無作為に抽選をすると、すべてのエントリーから抽選しているのですか?そうであれば、それを抽選しますか?ドローイングするときに、何を望みますか(例えば、インデックス、インデックス、要素の値、または...)?最後に、マトリックスがランダムマトリックスとしてあなたに来るのですか?あるいは、その表現があなたのコントロールにあるようなものから作られていますか? – lsfinn
3つの列形式、 (i、j、value)を使用すると、リストから項目を選択することができます。これを取得するには、(sparse()
にすなわち前駆体)スパース行列を作成するためにあなたの元のメソッドを使用するか、または、ラfind
コマンドを使用するか[i,j,s] = find(S);
あなたはエントリーを必要としない、そしてそれはあなたが思われる場合しないでください、あなたはi
とj
を抽出することができます。
何らかの理由でマトリクスが大量にあり、RAMの制限が厳しい場合は、単にマトリクスを領域に分割し、特定のサブマトリクスを選択する確率を非ゼロの数に比例させることができますその部分行列内の要素(nnz
を使用)を使用します。行列を個々の列に分割することができ、残りの計算は簡単です。注:マトリックスにsum
を適用すると、列ごとの数を得ることができます(エントリが1だけであると仮定します)。
このようにして、拒否サンプリングをする必要はありません(Matlabはゼロ以外のエントリがどこにあるかを知っているので、私には無意味です)。
あなたが心配しているのであれば、findはまばらな行列に最適化されていると思います。 –
実行時間ではなくメモリが心配です。しかし、実行時間の面でも、ほんのわずかな項目をサンプリングする場合は、効率的ではありません。 – user1210230
'nonzeros'は、行と列のインデックスを保存しないので、' find'よりもわずかにメモリ効率がよいはずです。 –