Remplir les zones de délimitation dans un tableau 2D

Question

J'ai un tableau numpy 2D qui ressemble à

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0.]]) `

Je veux créer une boîte englobante comme des masques sur les 1 indiqués ci-dessus. Par exemple, cela devrait ressembler à ceci

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.]])

Comment puis-je le faire facilement? Comment puis-je le faire si d'autres no.s comme 2,3 etc. existent mais je veux les ignorer et les groupes sont pour la plupart 2.

yatu · Accepted Answer

Nous avons skimage.measure pour vous faciliter la vie en matière d'étiquetage des composants. On peut utiliser skimage.measure.label pour étiqueter les différents composants du tableau, et skimage.measure.regionprops pour obtenir les tranches correspondantes, que nous pouvons utiliser pour définir les valeurs sur 1 dans ce cas:

def fill_bounding_boxes(x): from skimage.measure import label, regionprops l = label(x) for s in regionprops(l): x[s.slice] = 1 return x

Si nous essayons avec l'exemple proposé:

a = np.array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0.]])

On a:

fill_bounding_boxes(x) array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.], [0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0.]])

mrks · Answer

Bien que les réponses précédentes soient parfaitement correctes, voici comment vous pouvez le faire avec scipy.ndimage:

import numpy as np from scipy import ndimage def fill_bboxes(x): x_components, _ = ndimage.measurements.label(x, np.ones((3, 3))) bboxes = ndimage.measurements.find_objects(x_components) for bbox in bboxes: x[bbox] = 1 return x

ndimage.measurements.label fait un étiquetage de composant connecté avec la matrice 3x3- "uns" définissant le voisinage. find_objects détermine ensuite le cadre de délimitation de chaque composant, que vous pouvez ensuite utiliser pour définir tout à 1.

Martin · Answer

Il existe une solution , mais c'est un peu hacky et je ne la programmerai pas pour vous.

OpenCV - Bibliothèque de traitement d'images, dispose d'un algorithme pour trouver le contour rectangulaire -> Droit ou Roté. Ce que vous voudrez peut-être faire, c'est transformer votre tableau en image en niveaux de gris 2D, trouver des contours et écrire à l'intérieur des contours vos 1.

Vérifiez cette image - elle provient d'Opencv DOC - 7.a - https: // docs .opencv.org/3.4/dd/d49/tutorial_py_contour_features.html

Vous seriez intéressé par tout ce qui se trouve à l'intérieur des lignes vertes.

Pour être honnête, je pense qu'il me semble beaucoup plus facile que de programmer un algorithme pour les boîtes englobantes

Remarque

Bien sûr, vous n'avez pas vraiment besoin de faire les trucs d'image, mais je pense qu'il suffit d'utiliser l'algorithme d'opencv pour les boîtes englobantes (countours)

Prodipta Ghosh · Answer

C'est un problème intéressant. Une convolution 2D est une approche naturelle. Cependant, si la matrice d'entrée est clairsemée (comme cela apparaît dans votre exemple), cela peut être coûteux. Pour une matrice clairsemée, une autre approche consiste à utiliser un algorithme de clustering. Cela extrait uniquement les pixels non nuls de la zone de saisie a (le tableau dans votre exemple) et exécute un clustering hiérarchique. Le clustering est basé sur une matrice de distance spéciale (un Tuple). La fusion se produit si les boîtes sont séparées par un maximum de 1 pixel dans les deux sens. Vous pouvez également appliquer un filtre pour tous les nombres dont vous avez besoin dans l'étape d'initialisation (par exemple, ne le faites que pour un [row, col] == 1 et ignorez tous les autres nombres, ou tout ce que vous souhaitez.

from collections import namedtuple Point = namedtuple("Point",["x","y"]) # a pixel on the matrix Box = namedtuple("Box",["tl","br"]) # a box defined by top-lef/bottom-right def initialize(a): """ create a separate bounding box at each non-zero pixel. """ boxes = [] rows, cols = a.shape for row in range(rows): for col in range(cols): if a[row, col] != 0: boxes.append(Box(Point(row, col),Point(row, col))) return boxes def dist(box1, box2): """ dist between boxes is from top-left to bottom-right, or reverse. """ x = min(abs(box1.br.x - box2.tl.x), abs(box1.tl.x - box2.br.x)) y = min(abs(box1.br.y - box2.tl.y), abs(box1.tl.y - box2.br.y)) return x, y def merge(boxes, i, j): """ pop the boxes at the indices, merge and put back at the end. """ if i == j: return if i >= len(boxes) or j >= len(boxes): return ii = min(i, j) jj = max(i, j) box_i = boxes[ii] box_j = boxes[jj] x, y = dist(box_i, box_j) if x < 2 or y < 2: tl = Point(min(box_i.tl.x, box_j.tl.x),min(box_i.tl.y, box_j.tl.y)) br = Point(max(box_i.br.x, box_j.br.x),max(box_i.br.y, box_j.br.y)) del boxes[ii] del boxes[jj-1] boxes.append(Box(tl, br)) def cluster(a, max_iter=100): """ initialize the cluster. then loop through the length and merge boxes. break if `max_iter` reached or no change in length. """ boxes = initialize(a) n = len(boxes) k = 0 while k < max_iter: for i in range(n): for j in range(n): merge(boxes, i, j) if n == len(boxes): break n = len(boxes) k = k+1 return boxes cluster(a) # output: [Box(tl=Point(x=2, y=2), br=Point(x=5, y=4)),Box(tl=Point(x=11, y=9), br=Point(x=14, y=11))] # performance 275 µs ± 887 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each) # compares to 637 µs ± 9.36 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) for #the method based on 2D convolution

Cela renvoie une liste de cases définies par les points d'angle (en haut à gauche et en bas à droite). Ici, x est le numéro de ligne et y est le numéro de colonne. L'initialisation parcourt toute la matrice. Mais après cela, nous ne traitons qu'un très petit sous-ensemble de points. En modifiant la fonction dist, vous pouvez personnaliser la définition de la boîte (chevauchement, non chevauchement, etc.). Les performances peuvent en outre être optimisées (par exemple, en cas de rupture si i ou j est supérieure à la longueur des boîtes dans les boucles for, plutôt que de simplement revenir de la fonction de fusion et continuer).