2017-06-27 20 views
3

NumPy行列(2次元配列)を垂直方向と水平方向の両方に均等に分割する最も有望な方法は何ですか?例えばnumpy配列を水平方向と垂直方向に分割する

aa = np.reshape(np.arange(270),(18,15)) # a 18x15 matrix 

次いで

ab = np.split2d(aa,(2,3)) 

ような "機能" が形6つの行列(9,5)それぞれのリストをもたらします。最初の推測では、hsplitを組み合わせマップとvsplitですが、傷はそれを定義するには、2つのパラメータがある場合のように、適用されなければならない方法:

map(np.vsplit(@,3),np.hsplit(aa,2)) 
+0

(6,9,5)が右、得られたマトリックスの形状でなければなりませんか? – Nuageux

+0

はい、うまくいくかもしれませんが、(9,5,6)やNumPyの6つの配列の "非NumPy"リストでさえ、他の多くのNumPy関数のように十分です。 –

答えて

1

あなたは第二の分割は、単一のステップで行うことを可能にするために、後者をnp.split & np.concatenateを使用することができます。

def split_2d(array, splits): 
    x, y = splits 
    return np.split(np.concatenate(np.split(array, y, axis=1)), x*y) 

ab = split_2d(aa,(2,3)) 

ab[0].shape 
Out[95]: (9, 5) 

len(ab) 
Out[96]: 6 

しかし、N-DIMの場合に一般化することは比較的簡単ですようにこれも思えます私はまだその考え方をずっと進めていません。

編集:出力として単一のアレイについて

、ちょうどnp.stack追加:

np.stack(ab).shape 
Out[99]: (6, 9, 5) 
+0

ありがとう@EFT! –

4

ここでnumpyの環境内に留まる一つの方法だ -

def view_as_blocks(arr, BSZ): 
    # arr is input array, BSZ is block-size 
    m,n = arr.shape 
    M,N = BSZ 
    return arr.reshape(m//M, M, n//N, N).swapaxes(1,2).reshape(-1,M,N) 

In [41]: aa = np.reshape(np.arange(270),(18,15)) 

In [42]: view_as_blocks(aa, (9,5)).shape 
Out[42]: (6, 9, 5) 

サンプルは、形状を確認するために

1)実際の大きなケースを実行します

2)手動で値を確認するために、小型ケース:あなたは他のライブラリで動作するように喜んでいる場合

In [43]: aa = np.reshape(np.arange(36),(6,6)) 

In [44]: aa 
Out[44]: 
array([[ 0, 1, 2, 3, 4, 5], 
     [ 6, 7, 8, 9, 10, 11], 
     [12, 13, 14, 15, 16, 17], 
     [18, 19, 20, 21, 22, 23], 
     [24, 25, 26, 27, 28, 29], 
     [30, 31, 32, 33, 34, 35]]) 

In [45]: view_as_blocks(aa, (2,3)) # Blocks of shape (2,3) 
Out[45]: 
array([[[ 0, 1, 2], 
     [ 6, 7, 8]], 

     [[ 3, 4, 5], 
     [ 9, 10, 11]], 

     [[12, 13, 14], 
     [18, 19, 20]], 

     [[15, 16, 17], 
     [21, 22, 23]], 

     [[24, 25, 26], 
     [30, 31, 32]], 

     [[27, 28, 29], 
     [33, 34, 35]]]) 

を、scikit-imageはそうのように、ここでの使用の可能性 -

from skimage.util import view_as_blocks as viewB 

out = viewB(aa, tuple(BSZ)).reshape(-1,*BSZ) 

ランタイムテスト -

In [103]: aa = np.reshape(np.arange(270),(18,15)) 

# @EFT's soln 
In [99]: %timeit split_2d(aa, (2,3)) 
10000 loops, best of 3: 23.3 µs per loop 

# @glegoux's soln-1 
In [100]: %timeit list(get_chunks(aa, 2,3)) 
100000 loops, best of 3: 3.7 µs per loop 

# @glegoux's soln-2 
In [111]: %timeit list(get_chunks2(aa, 9, 5)) 
100000 loops, best of 3: 3.39 µs per loop 

# Proposed in this post 
In [101]: %timeit view_as_blocks(aa, (9,5)) 
1000000 loops, best of 3: 1.86 µs per loop 

それらの定義によって、split_2dおよびget_chunksについてはであり、それらはブロックの数としてこれを使用している。私の場合、view_as_blocksで、私はブロックサイズを示すパラメータBSZを持っています。だから、(9,5)があります。 get_chunks2は、view_as_blocksと同じ形式に従います。出力は同じものを表す必要があります。それのような2×3のブロック(9,5)で

+-+-+-+ 
+  + 
+-+-+-+ 

+-+-+-+ 
+-+-+-+ 
+-+-+-+ 

の操作を行います。

from pprint import pprint 
import numpy as np 

M = np.reshape(np.arange(18*15),(18,15)) 

def get_chunks(M, n, p): 
    n = len(M)//n 
    p = len(M[0])//p 
    for i in range(0, len(M), n): 
     for j in range(0, len(M[0]), p): 
      yield M[i:i+n,j:j+p] 

def get_chunks2(M, n, p): 
     for i in range(0, len(M), n): 
      for j in range(0, len(M[0]), p): 
       yield M[i:i+n,j:j+p] 

# list(get_chunks2(M, 9, 5)) same result more faster 
chunks = list(get_chunks(M, 2, 3)) 

pprint(chunks) 

出力、このマトリックス(18,15)をカットする

+0

修正 'aa' - > 'arr' – glegoux

+0

ありがとう@Divakar!ありがとう@glegoux! –

+0

@NickPanovいつも楽しいです! – Divakar

2

[array([[ 0, 1, 2, 3, 4], 
     [ 15, 16, 17, 18, 19], 
     [ 30, 31, 32, 33, 34], 
     [ 45, 46, 47, 48, 49], 
     [ 60, 61, 62, 63, 64], 
     [ 75, 76, 77, 78, 79], 
     [ 90, 91, 92, 93, 94], 
     [105, 106, 107, 108, 109], 
     [120, 121, 122, 123, 124]]), 
array([[ 5, 6, 7, 8, 9], 
     [ 20, 21, 22, 23, 24], 
     [ 35, 36, 37, 38, 39], 
     [ 50, 51, 52, 53, 54], 
     [ 65, 66, 67, 68, 69], 
     [ 80, 81, 82, 83, 84], 
     [ 95, 96, 97, 98, 99], 
     [110, 111, 112, 113, 114], 
     [125, 126, 127, 128, 129]]), 
array([[ 10, 11, 12, 13, 14], 
     [ 25, 26, 27, 28, 29], 
     [ 40, 41, 42, 43, 44], 
     [ 55, 56, 57, 58, 59], 
     [ 70, 71, 72, 73, 74], 
     [ 85, 86, 87, 88, 89], 
     [100, 101, 102, 103, 104], 
     [115, 116, 117, 118, 119], 
     [130, 131, 132, 133, 134]]), 
array([[135, 136, 137, 138, 139], 
     [150, 151, 152, 153, 154], 
     [165, 166, 167, 168, 169], 
     [180, 181, 182, 183, 184], 
     [195, 196, 197, 198, 199], 
     [210, 211, 212, 213, 214], 
     [225, 226, 227, 228, 229], 
     [240, 241, 242, 243, 244], 
     [255, 256, 257, 258, 259]]), 
array([[140, 141, 142, 143, 144], 
     [155, 156, 157, 158, 159], 
     [170, 171, 172, 173, 174], 
     [185, 186, 187, 188, 189], 
     [200, 201, 202, 203, 204], 
     [215, 216, 217, 218, 219], 
     [230, 231, 232, 233, 234], 
     [245, 246, 247, 248, 249], 
     [260, 261, 262, 263, 264]]), 
array([[145, 146, 147, 148, 149], 
     [160, 161, 162, 163, 164], 
     [175, 176, 177, 178, 179], 
     [190, 191, 192, 193, 194], 
     [205, 206, 207, 208, 209], 
     [220, 221, 222, 223, 224], 
     [235, 236, 237, 238, 239], 
     [250, 251, 252, 253, 254], 
     [265, 266, 267, 268, 269]])] 
+0

ありがとう@glegoux! –

関連する問題