Avant de commencer à utiliser Ubuntu, j'utilisais Nitro PDF reader pour extraire automatiquement les images des fichiers PDF. Existe-t-il un lecteur PDF pour Linux qui le fasse?
J'aimerais pouvoir extraire des images plus rapidement/plus facilement que lors d'une prise de vue instantanée.
pdfimages
pdfimages
est un outil d'extraction d'images PDF qui enregistre les images dans un fichier PDF au format de fichier PPM, PBM, JPEG ou JPEG 2000.
Cela fait partie du paquetage poppler-utils
, que vous devrez installer.
Utilisation: pdfimages [options] <PDF-file> <image-root>
Exemple: Ce qui suit extrait toutes les images d'un fichier PDF, en les enregistrant au format JPEG.
pdfimages -j in.pdf /tmp/out
Sauvegardera les images du PDF fichier in.pdf
dans les fichiers /tmp/out-000.jpg
(ou /tmp/out-000.pbm
; voir ci-dessous), /tmp/out-001.jpg
, etc.
Pdfimages page de manuel explique:
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
J'utilise souvent Inkscape pour cela. Chargez la page et supprimez tous les autres éléments. L'avantage est que vous pouvez obtenir des images vectorielles au format SVG et les modifier à votre guise.
J'ai un fichier PDF à double colonne avec des images incorporées créées avec LaTeX, où les images d'origine ont été fournies au format EPS. J'ai essayé la solution proposée basée sur pdfimages
, mais malheureusement, elle n'a renvoyé aucune image. J'ai alors essayé d'utiliser Inkscape, mais les images SVG générées étaient déformées et je n'ai pas eu la chance de les exporter au format EPS.
Le logiciel qui a fonctionné pour nous était le MasterPdfEditor .
Voici la procédure
Le résultat est de très haute qualité, mais le logiciel n’est pas gratuit. Il existe une version de démonstration qui "vous permet d'essayer toutes les fonctionnalités", mais vient avec "l'ajout d'un filigrane sur le fichier de sortie". Pour être franc, je n'ai pas remarqué de filigrane dans le fichier PDF produit.
Vous pouvez également essayer pdfmod. C'est une interface graphique qui permet d'extraire des images et d'effectuer d'autres manipulations de base en pdf.
Si vous avez besoin d’une image recadrée au format pdf/eps, extrayez une page avec l’image en utilisant pdfmod
(comme suggéré par Tâches).
Ensuite, en utilisant pdfcrop
, vous pouvez le rogner correctement en définissant les marges par essais et erreurs:
pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
Si vous souhaitez recadrer une image à partir d'un pdf avec un pdfviewer, vous pouvez essayer okular. Il peut rogner n'importe quoi (textes ou images) au format png ou jpeg. Si vous souhaitez extraire des images au format png à partir d'un fichier PDF, vous pouvez le faire avec une commande minimale avec pdftohtml. Il convertit le pdf en html plus des images. Ici vous pouvez trouver un exemple - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Si vous souhaitez extraire de nombreuses images d'un fichier PDF, je vous suggère d'essayer.
J'utilise pdfimages, un outil de ligne de commande qui fonctionne très bien pour moi. Il est très facile à utiliser et vous pouvez utiliser l'option --help pour en savoir plus sur son utilisation. J'utilise Ubuntu et il est pré-installé. Si vos fichiers pdf sont cryptés ou protégés par un mot de passe, il existe des options pour cela, donc cet outil fonctionne très bien. Vous pouvez lire plus sur pdfimages ici
Avec pdfimages, l'image extraite peut être en deux parties ou plus. Un moyen simple de les réassembler sans vous soucier des formats extraits consiste à importer les pièces dans LibreOffice Draw, à les rogner à l'aide du dialogue de rognage d'image, à les positionner, à ajuster la taille de la page et à l'exportation dans le format de votre choix.
Logiciels utilisés: OS Xreader: Antergos
Pas: