2017-10-13 6 views
0

おそらく、これが提起されて別の場所で解決されていますが、私はそれを見つけられませんでした。各スライスもaに対して有効であるようにnumpy配列を使ってインデックスをスライスする方法は?

a = np.arange(100).reshape(10,10) 
b = np.zeros(a.shape) 
start = np.array([1,4,7]) # can be arbitrary but valid values 
end = np.array([3,6,9])  # can be arbitrary but valid values 

startendの両方が有効な値を持っている:私たちはnumpyの配列があるとし 。 私はb内でのスポットを対応するaにサブアレイの値をコピーしたい:この構文は動作しません

b[:, start:end] = a[:, start:end] #error 

、それはと同等です:よりよいがある場合、私は疑問に思う

b[:, start[0]:end[0]] = a[:, start[0]:end[0]] 
b[:, start[1]:end[1]] = a[:, start[1]:end[1]] 
b[:, start[2]:end[2]] = a[:, start[2]:end[2]] 

startend配列の明示的なfor-loopではなく、これを行う方法です。

ありがとうございます!

+0

開始と終了のペアには常に一定の差異(ここでは2)がありますか? – Divakar

+0

必ずしもそうではありませんが、これは単なる例ですが、インデックスは有効なものであると仮定して、 – galactica

答えて

1

我々はstartに対する比較の二組とend配列で編集する場所のマスクを作成するためにbroadcastingを使用して、単純にベクトル化ソリューションをboolean-indexingに割り当てることができます -

# Range array for the length of columns 
r = np.arange(b.shape[1]) 

# Broadcasting magic to give us the mask of places 
mask = (start[:,None] <= r) & (end[:,None] >= r) 

# Boolean-index to select and assign 
b[:len(mask)][mask] = a[:len(mask)][mask] 

サンプル実行 -

In [222]: a = np.arange(50).reshape(5,10) 
    ...: b = np.zeros(a.shape,dtype=int) 
    ...: start = np.array([1,4,7]) 
    ...: end = np.array([5,6,9]) # different from sample for variety 
    ...: 

# Mask of places to be edited 
In [223]: mask = (start[:,None] <= r) & (end[:,None] >= r) 

In [225]: print mask 
[[False True True True True True False False False False] 
[False False False False True True True False False False] 
[False False False False False False False True True True]] 

In [226]: b[:len(mask)][mask] = a[:len(mask)][mask] 

In [227]: a 
Out[227]: 
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
     [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], 
     [30, 31, 32, 33, 34, 35, 36, 37, 38, 39], 
     [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]]) 

In [228]: b 
Out[228]: 
array([[ 0, 1, 2, 3, 4, 5, 0, 0, 0, 0], 
     [ 0, 0, 0, 0, 14, 15, 16, 0, 0, 0], 
     [ 0, 0, 0, 0, 0, 0, 0, 27, 28, 29], 
     [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 
     [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]) 
+0

で索引付けしてください!ありがとうございます!このマスクトリックはきれいに見えます!しかし、この例では、ndarray全体のコピーを作成するなど、効率の問題が生じますか?実際のシナリオでは、かなり大きいndarrayがあります。たとえば、a.shape =(128,32x32x32)です。このような値の割り当ては、繰り返しごとに異なる開始/終了値に応じて複数回繰り返されます。 – galactica

+0

@galacticaを参照して?どちらのステップを参照していますか? – Divakar

+0

@galacticaコピーについて: 'a [:len(mask)] [mask]'は、マスキングで回避することはできず、すべてをベクトル化してスライスすることはできません。だから、メモリ効率が懸念されている場合、私はループを維持し、次のようなものを使用していると推測します: 'b [0、start [0]:end [0]] = a [0、start [0]:end [0]]'等々。 – Divakar

関連する問題