Mon problème est que je suis chargé d'extraire des images d'un fichier PDF de 640 pages.
La majorité sont des graphiques et des tableaux avec des textes. Faire un simple copier-coller entraîne la perte de résolution de l'image et rend les textes flous et parfois illisibles.
Connaissez-vous un meilleur moyen d’extraire des images d’un fichier PDF sans en altérer la résolution?
À partir de la suite XPDF (qui est un logiciel libre et à code source ouvert), vous pouvez utiliser pdfimages.exe
outil CLI pour: extraire toutes les images d’un fichier PDF, ou simplement toutes les images d’une série de pages. Voici un exemple pour extraire toutes les images des pages 33 à 36:
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
Le -j
essaiera d'extraire les images JPEG incorporées au format JPEG. Toutes les autres images sont générées en tant que fichiers PPM (pixmaps portables). Attention, les PPM sont totalement décompressés!
ceci est très facile avec evince
(la visionneuse de documents) dans Ubuntu. Ouvrez simplement le fichier pdf en utilisant evince
, puis enlevez la taille maximale, marquez-le Always on top
puis faites glisser et déposez l'image dans le dossier de votre choix.
PHOTOSHOP! Ouvrez le PDF dans Photoshop. (Utilisation de Photoshop CC sur Windows 7)
L'extraction des images de résolution d'origine est l'une des fonctionnalités gratuites du kit de développement logiciel (SDK) de Solid Framework. Par conséquent, si vous créez votre solution en C #, voici ce qui se passe: http://www.soliddocuments.com/features. htm? product = SolidFramework
L’exemple d’application illustrant cette fonctionnalité est également gratuit si vous avez besoin d’une solution de traitement par lots avec une interface graphique: http://www.pdf-internals.com/download.htm?product=SolidPDFMechanic
(Je suis avec des documents solides)
(1) Vous pouvez ouvrir le fichier dans Word 2013 (il suffit d'utiliser Fichier - Ouvrir), où vous pouvez copier l'image. La résolution est suffisante pour l’impression, mais vous ne savez pas si elle correspond à l’original.
(2) Visionneur de freeware SumatraPDF (très bon si vous utilisez LaTeX) a une option de menu "Copier image "lorsque vous cliquez avec le bouton droit sur l'image. Je pense que cela préserve la résolution (même si j'ai vu des fichiers dont je ne pouvais pas copier les images).
(3) Adobe Acrobat X , sous Fichier, contient Enregistrer sous Autre - Image et utilise par défaut la haute résolution (dans les cas où j'ai essayé, il s'agissait de la résolution d'origine) .
(4) En Perl , il existe plus d'une façon, par exemple, lire ici et plus particulièrement il programme pour extraire des images JPEG de tout , ce qui a fonctionné parfaitement pour moi et extrait définitivement les images JPEG de résolution originale.
Vous pouvez utiliser Imagemagick pour convertir toutes les pages PDF en fichiers image séparés (bien que je ne sache pas combien de temps il faudra pour le faire un document aussi volumineux, ou s’il y parvient!), puis écrivez ce que vous voulez. Cela vaut peut-être la peine de faire un essai avec ceci, car au moins vous saurez si la résolution des images incorporées convient à ce dont vous avez besoin.
Si vous possédez Acrobat pro, il s'agit de loin du moyen le plus simple de prendre un cliché haute résolution (définissez-le à la hauteur souhaitée). Dans Préférences/Général, cochez la case ", utilisez une résolution fixe pour l'outil d'instantané " et réglez la résolution à votre convenance, par exemple 300ppi ou plus. Ensuite, prenez un instantané (outils/sélectionner et zoomer/outil instantané) et il copiera une copie haute résolution dans votre presse-papiers. Puis collez-le de votre presse-papiers où vous voulez. fonctionne très bien.
Pour voir une description plus détaillée, cliquez sur ce lien ...
J'extrais généralement des images en ouvrant les fichiers pdf dans Adobe Illustrator, puis en les copiant et en les collant dans InDesign. La résolution préserve.
Le meilleur moyen consiste à utiliser Adobe Acrobat Pro (2010 ou versions ultérieures). Allez dans Fichier -> Enregistrer sous -> Plus d'options -> PostScript encapsulé, puis cliquez sur Enregistrer.
Sur un Mac, vous pouvez exporter des images ou une page complète à partir de Aperçu et obtenir la résolution complète. On vous demandera quelle résolution vous voulez dans une boîte de dialogue.
Non, copier et coller doivent conserver la résolution d'origine de la ressource incorporée. Ce qui est le plus susceptible de se produire est qu'il s'agit d'une image à faible résolution qui a été réduite dans le fichier PDF; si elle est exportée, elle semble pire qu'elle ne l'est.
Essayez de le réduire et/ou de lui donner la même taille que dans le PDF et il devrait en fait être identique.
Sinon, (et la pire option) allez à 100% de zoom et faites une capture d'écran ou utilisez l'outil de coupure dans Windows Vista/Windows 7.
REMARQUE - Les images dans .PDF
s sont généralement réduites/compressées au moment où elles sont converties en un .PDF
. Toutefois, une fois compressé, vous devriez pouvoir extraire avec la même qualité que PDF
et non moins.
Quel PDF logiciel de visualisation utilisez-vous?
En utilisant un programme PDF d'édition/création , tel que Adobe Acrobat Pro , vous devriez être capable d'extraire les images incorporées telles qu'elles se trouvent dans le fichier PDF. Vous pouvez obtenir une version d'évaluation gratuite sur le site Adobe (pour Windows et Mac), que vous pouvez utiliser uniquement à des fins spécifiques.
* tant qu'ils ne sont pas protégés, auquel cas vous devrez .. euh, je ne vais pas y aller ...
Adobe Acrobat Pro
Fichier> Enregistrer sous utilisera les paramètres Convert-De-PDF sous "Edition> Préférences".
[Conversion à partir de PDF] autorisera [Modifier les paramètres ...] pour chaque format de fichier
La qualité optimale dépend des images source et de la résolution utilisée pour créer le fichier PDF.
Mais vous pouvez obtenir de très bons résultats en modifiant les paramètres TIFF sans perte.
Définissez la résolution sur 1 200 ou plus (si l'option Enregistrer échoue, définissez une valeur inférieure), puis utilisez le fichier d'origine> Enregistrer sous pour rendre le fichier PDF en fichiers individuels à haute résolution.
Pas le meilleur moyen, mais vraiment beaucoup mieux que le rendu sous un type de document différent.
Les fichiers seront très gros, mais plus appropriés pour couper et coller
Dans Adobe InDesign, vous pouvez utiliser la commande "Importer" pour importer un fichier PDF. Si vous souhaitez importer des pages spécifiques, cochez la case Afficher les options d'importation dans la boîte de dialogue qui s'affiche après avoir cliqué sur la commande Importer. Faites glisser et redimensionnez le cadre de sorte que ce que vous avez besoin d'image haute résolution tienne dans la page. Vous devez souvent redimensionner la taille de la page du document en fonction du rapport de format de l’image. Une fois que vous êtes satisfait de ce que vous voyez, utilisez la commande Exporter et sélectionnez PDF haute qualité. Cela créera une haute résolution PDF que vous pourrez imprimer ou utiliser dans les documents Latex.