Eu tenho uma matriz 2D NumPy e gostaria de substituir todos os valores nela maiores ou iguais a um limiar T por 255,0. Para o meu conhecimento, a forma mais fundamental seria:
shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
for y in range(0, shape[1]):
if arr[x, y] >= T:
result[x, y] = 255
Qual é a forma mais concisa e pítonica de fazer isto?
Existe uma maneira mais rápida (possivelmente menos concisa e/ou menos pítonica) de fazer isso?
Isto fará parte de uma sub-rotina de ajuste de janela/nível para a ressonância magnética da cabeça humana. A matriz numérica 2D são os dados de pixel da imagem.
Eu acho que a maneira mais rápida e concisa de fazer isso é usar o NumPy's incorporado Fancy indexing. Se você tiver um ndarray
chamado arr
, você pode substituir todos os elementos >255
por um valor x
como a seguir:
arr[arr > 255] = x
Eu executei isto na minha máquina com uma matriz aleatória de 500 x 500, substituindo todos os valores >0.5 por 5, e levou uma média de 7.59ms.
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
Como você realmente quer um array diferente que é "arr" onde "arr < 255", e "255" de outra forma, isso pode ser feito de forma simples:
result = np.minimum(arr, 255)
Mais genericamente, para um limite inferior e/ou superior:
result = np.clip(arr, 0, 255)
Se você só quer acessar os valores acima de 255, ou algo mais complicado, @mtitan8'a resposta do @mtitan8'a resposta é mais geral, mas np.clip
e np.minimum
(ou np.maximum
) são mais agradáveis e muito mais rápidas para o seu caso:
In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop
In [293]: %%timeit
.....: c = np.copy(a)
.....: c[a>255] = 255
.....:
10000 loops, best of 3: 86.6 µs per loop
Se você quiser fazê-lo no local (ou seja, modificar arr
ao invés de criar resultado
) você pode utilizar o parâmetro out
de np.minimum
:
np.minimum(arr, 255, out=arr)
ou
np.clip(arr, 0, 255, arr)
(o nome out=
é opcional uma vez que os argumentos na mesma ordem que a função's definição).
Para modificação no local, a indexação booleana acelera muito (sem ter que fazer e depois modificar a cópia separadamente), mas ainda não é tão rápida quanto mínima
:
In [328]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: np.minimum(a, 255, a)
.....:
100000 loops, best of 3: 303 µs per loop
In [329]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: a[a>255] = 255
.....:
100000 loops, best of 3: 356 µs per loop
Para comparação, se você quisesse restringir seus valores com um mínimo e um máximo, sem o `clip' você teria que fazer isso duas vezes, com algo como
np.minimum(a, 255, a)
np.maximum(a, 0, a)
ou..,
a[a>255] = 255
a[a<0] = 0
Você pode considerar o uso de numpy.putmask:
np.putmask(arr, arr>=T, 255.0)
Aqui está uma comparação de desempenho com o Numpy's builtin indexing:
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop
In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop