web-dev-qa-db-fra.com

outil de ligne de commande pour extraire en vrac des images d'un fichier PDF?

J'ai un catalogue pdf qui m'a été donné par un client au format pdf. Ils n'ont pas les images mais ils sont dans le pdf.

Existe-t-il un moyen d'extraire toutes les images d'un fichier PDF à l'aide d'un outil de ligne de commande tout en préservant les noms de fichier d'origine?

J'ai examiné ce fil de discussion ( Extraire les images de PDF avec des masques de calque ), mais il ne s'agit que d'images individuelles.

13
chrisjlee

Le programme pdfimages du paquet poppler-utils pourrait être ce que vous recherchez. De la page de manuel:

Pdfimages lit le fichier PDF PDF, numérise une ou plusieurs pages et écrit un fichier PPM, PBM ou JPEG pour chaque image.

Sur les versions plus récentes de poppler-utils, il existe un commutateur all pour extraire au format jpg ou png:

pdfimages -all input.pdf images/prefix

affichera les fichiers sous la forme préfixe-nnn. [png | jpg] dans les images dossier.

18
Marco