Je veux convertir une image en tableau 2D avec 5 colonnes où chaque ligne est de la forme [r, g, b, x, y]
. x, y est la position du pixel et r, g, b sont les valeurs de pixel. (J'utiliserai ce tableau en tant qu'entrée dans un modèle d'apprentissage automatique). Existe-t-il une implémentation plus efficace que celle-ci en python?
import Image
import numpy as np
im = Image.open("farm.jpg")
col,row = im.size
data = np.zeros((row*col, 5))
pixels = im.load()
for i in range(row):
for j in range(col):
r,g,b = pixels[i,j]
data[i*col + j,:] = r,g,b,i,j
J'ai dû écrire cela récemment et j'ai fini avec
indices = np.dstack(np.indices(im.shape[:2]))
data = np.concatenate((im, indices), axis=-1)
Où im
est un tableau numpy. Il est probablement préférable de lire les images directement dans des tableaux numpy avec
from scipy.misc import imread
im = imread("farm.jpg")
Ou mieux encore si vous avez installé Scikit Image
from skimage.io import imread
im = imread("farm.jpg")
Je ne suis pas sûr que ce soit le très efficace. Mais voilà, dites arr = np.array(im)
; alors vous pouvez faire quelque chose comme ça.
>>> arr = np.arange(150).reshape(5, 10, 3)
>>> x, y, z = arr.shape
>>> indices = np.vstack(np.unravel_index(np.arange(x*y), (y, x))).T
#or indices = np.hstack((np.repeat(np.arange(y), x)[:,np.newaxis], np.tile(np.arange(x), y)[:,np.newaxis]))
>>> np.hstack((arr.reshape(x*y, z), indices))
array([[ 0, 1, 2, 0, 0],
[ 3, 4, 5, 0, 1],
[ 6, 7, 8, 0, 2],
[ 9, 10, 11, 0, 3],
[ 12, 13, 14, 0, 4],
[ 15, 16, 17, 1, 0],
[ 18, 19, 20, 1, 1],
[ 21, 22, 23, 1, 2],
[ 24, 25, 26, 1, 3],
[ 27, 28, 29, 1, 4],
[ 30, 31, 32, 2, 0],
[ 33, 34, 35, 2, 1],
[ 36, 37, 38, 2, 2],
...
[129, 130, 131, 8, 3],
[132, 133, 134, 8, 4],
[135, 136, 137, 9, 0],
[138, 139, 140, 9, 1],
[141, 142, 143, 9, 2],
[144, 145, 146, 9, 3],
[147, 148, 149, 9, 4]])
J'ai utilisé "+" pour combiner deux tuple et utiliser .append()
pour créer la liste "data". Vous n'avez pas besoin d'utiliser Numpy ici.
row,col = im.size
data=[] #r,g,b,i,j
pixels=im.load()
for i in range(row):
for j in range(col):
data.append(pixels[i,j]+(i,j))