J'ai un catalogue pdf qui m'a été donné par un client au format pdf. Ils n'ont pas les images mais ils sont dans le pdf.
Existe-t-il un moyen d'extraire toutes les images d'un fichier PDF à l'aide d'un outil de ligne de commande tout en préservant les noms de fichier d'origine?
J'ai examiné ce fil de discussion ( Extraire les images de PDF avec des masques de calque ), mais il ne s'agit que d'images individuelles.
Le programme pdfimages
du paquet poppler-utils
pourrait être ce que vous recherchez. De la page de manuel:
Pdfimages lit le fichier PDF PDF, numérise une ou plusieurs pages et écrit un fichier PPM, PBM ou JPEG pour chaque image.
Sur les versions plus récentes de poppler-utils, il existe un commutateur all
pour extraire au format jpg ou png:
pdfimages -all input.pdf images/prefix
affichera les fichiers sous la forme préfixe-nnn. [png | jpg] dans les images dossier.