Convertir une image en tableau 2D en python

Question

Je veux convertir une image en tableau 2D avec 5 colonnes où chaque ligne est de la forme [r, g, b, x, y]. x, y est la position du pixel et r, g, b sont les valeurs de pixel. (J'utiliserai ce tableau en tant qu'entrée dans un modèle d'apprentissage automatique). Existe-t-il une implémentation plus efficace que celle-ci en python?

import Image import numpy as np im = Image.open("farm.jpg") col,row = im.size data = np.zeros((row*col, 5)) pixels = im.load() for i in range(row): for j in range(col): r,g,b = pixels[i,j] data[i*col + j,:] = r,g,b,i,j

YXD · Accepted Answer

J'ai dû écrire cela récemment et j'ai fini avec

indices = np.dstack(np.indices(im.shape[:2])) data = np.concatenate((im, indices), axis=-1)

Où im est un tableau numpy. Il est probablement préférable de lire les images directement dans des tableaux numpy avec

from scipy.misc import imread im = imread("farm.jpg")

Ou mieux encore si vous avez installé Scikit Image

from skimage.io import imread im = imread("farm.jpg")

Ashwini Chaudhary · Answer

Je ne suis pas sûr que ce soit le très efficace. Mais voilà, dites arr = np.array(im); alors vous pouvez faire quelque chose comme ça.

>>> arr = np.arange(150).reshape(5, 10, 3) >>> x, y, z = arr.shape >>> indices = np.vstack(np.unravel_index(np.arange(x*y), (y, x))).T #or indices = np.hstack((np.repeat(np.arange(y), x)[:,np.newaxis], np.tile(np.arange(x), y)[:,np.newaxis])) >>> np.hstack((arr.reshape(x*y, z), indices)) array([[ 0, 1, 2, 0, 0], [ 3, 4, 5, 0, 1], [ 6, 7, 8, 0, 2], [ 9, 10, 11, 0, 3], [ 12, 13, 14, 0, 4], [ 15, 16, 17, 1, 0], [ 18, 19, 20, 1, 1], [ 21, 22, 23, 1, 2], [ 24, 25, 26, 1, 3], [ 27, 28, 29, 1, 4], [ 30, 31, 32, 2, 0], [ 33, 34, 35, 2, 1], [ 36, 37, 38, 2, 2], ... [129, 130, 131, 8, 3], [132, 133, 134, 8, 4], [135, 136, 137, 9, 0], [138, 139, 140, 9, 1], [141, 142, 143, 9, 2], [144, 145, 146, 9, 3], [147, 148, 149, 9, 4]])

羅一中 · Answer

J'ai utilisé "+" pour combiner deux tuple et utiliser .append() pour créer la liste "data". Vous n'avez pas besoin d'utiliser Numpy ici.

row,col = im.size data=[] #r,g,b,i,j pixels=im.load() for i in range(row): for j in range(col): data.append(pixels[i,j]+(i,j))