Obtenez les données de pixels sous forme de tableau à partir de UIImage / CGImage dans swift

Question

Jusqu'à présent, j'ai une application qui permet à l'utilisateur de dessiner librement (comme un carnet de croquis) sur un élément UIImageView.

Je veux obtenir les données brutes de pixels RVB (comme 0 à 255 valeurs entières) comme un tableau multidimensionnel afin que je puisse l'intégrer dans un algorithme d'apprentissage automatique. Ou existe-t-il un autre moyen d'envoyer les données d'image brutes vers une fonction C++ distincte?

Existe-t-il un moyen facile de le faire dans Swift?

Luca Torella · Answer

Dans Swift 3 et Swift 4, en utilisant Core Graphics, il est assez facile de faire ce que vous voulez:

extension UIImage { func pixelData() -> [UInt8]? { let size = self.size let dataSize = size.width * size.height * 4 var pixelData = [UInt8](repeating: 0, count: Int(dataSize)) let colorSpace = CGColorSpaceCreateDeviceRGB() let context = CGContext(data: &pixelData, width: Int(size.width), height: Int(size.height), bitsPerComponent: 8, bytesPerRow: 4 * Int(size.width), space: colorSpace, bitmapInfo: CGImageAlphaInfo.noneSkipLast.rawValue) guard let cgImage = self.cgImage else { return nil } context?.draw(cgImage, in: CGRect(x: 0, y: 0, width: size.width, height: size.height)) return pixelData } }

Cameron Lowell Palmer · Answer

Conversion d'une CGImage en un tableau de valeurs d'intensité

Ma fonction prend un CGImage et retourne un tableau d'entiers 8 bits non signés ainsi que la largeur et la hauteur de l'image. J'ai écrit ce code pour une utilisation avec des images en niveaux de gris. L'extension à la couleur devrait être une question de changer le gris en RVB et de changer les octets par pixel à 3 en supposant qu'il n'y ait pas de canal alpha.

func pixelValues(fromCGImage imageRef: CGImage?) -> (pixelValues: [UInt8]?, width: Int, height: Int) { var width = 0 var height = 0 var pixelValues: [UInt8]? if let imageRef = imageRef { width = imageRef.width height = imageRef.height let bitsPerComponent = imageRef.bitsPerComponent let bytesPerRow = imageRef.bytesPerRow let totalBytes = height * bytesPerRow let colorSpace = CGColorSpaceCreateDeviceGray() var intensities = [UInt8](repeating: 0, count: totalBytes) let contextRef = CGContext(data: &intensities, width: width, height: height, bitsPerComponent: bitsPerComponent, bytesPerRow: bytesPerRow, space: colorSpace, bitmapInfo: 0) contextRef?.draw(imageRef, in: CGRect(x: 0.0, y: 0.0, width: CGFloat(width), height: CGFloat(height))) pixelValues = intensities } return (pixelValues, width, height) } func image(fromPixelValues pixelValues: [UInt8]?, width: Int, height: Int) -> CGImage? { var imageRef: CGImage? if var pixelValues = pixelValues { let bitsPerComponent = 8 let bytesPerPixel = 1 let bitsPerPixel = bytesPerPixel * bitsPerComponent let bytesPerRow = bytesPerPixel * width let totalBytes = height * bytesPerRow imageRef = withUnsafePointer(to: &pixelValues, { ptr -> CGImage? in var imageRef: CGImage? let colorSpaceRef = CGColorSpaceCreateDeviceGray() let bitmapInfo = CGBitmapInfo(rawValue: CGImageAlphaInfo.none.rawValue).union(CGBitmapInfo()) let data = UnsafeRawPointer(ptr.pointee).assumingMemoryBound(to: UInt8.self) let releaseData: CGDataProviderReleaseDataCallback = { (info: UnsafeMutableRawPointer?, data: UnsafeRawPointer, size: Int) -> () in } if let providerRef = CGDataProvider(dataInfo: nil, data: data, size: totalBytes, releaseData: releaseData) { imageRef = CGImage(width: width, height: height, bitsPerComponent: bitsPerComponent, bitsPerPixel: bitsPerPixel, bytesPerRow: bytesPerRow, space: colorSpaceRef, bitmapInfo: bitmapInfo, provider: providerRef, decode: nil, shouldInterpolate: false, intent: CGColorRenderingIntent.defaultIntent) } return imageRef }) } return imageRef }