web-dev-qa-db-fra.com

Split PDF Document de la ligne de commande sous Linux?

J'aimerais extraire des gammes de page d'un document PDF _ dans un nouveau document PDF à l'aide de la ligne de commande sous Linux. Noter que:

 $ PDFTK INPUTT.PDF CAT 1 VERBOSE SORTIE SORTIE.PDF 
 ERREUR: Échec de l'open PDF Fichier: 
 Erreurs.PDF [. rencontré. Aucune sortie créée. 
 FAIT. Erreurs d'entrée, donc aucune sortie créée. 

Il s'avère que " vous (devrait) savoir que PDFTK n'est rien de plus qu'une très ancienne version d'ITEXT .... Les mots-clés de la déclaration ci-dessus sont" très vieux ". "(de PDFTK ne peut pas ouvrir le fichier PDF )

 $ Java -classpath /path/to/multivalent20091027.jar Tool.pdf.split -Page 1 INPUT.PDF [ : Outil/PDF/Split [.____] Causé par: Java.Lang.classnotFoundException: outil.pdf.split [.____] à java.net.urlclassloader $ 1.Run (urlclassloader.java:202) 
 à java.security.accesscontroller.doprivilited (méthode natif) [.____] à java.net.urlclassloader.findclass (urlclassloader.java:190) [.____] à java.lang.classloader.loadclass (classloader.java : 306) [.____] au soleil.misc.launcher $ AppClassLoader.loadclass (Launcher.java:301) [ Impossible de trouver la classe principale: outil.pdf.split. Programme va sortir. 

S'avère, c'est un peu un logiciel délicat: même si c'est sur Sourceforge, et dit que " pensée pratique généreusement fournit ces outils d'utilisation gratuite sur la ligne de commande " ici - Cependant, ici Ensuite, il est indiqué:" Le navigateur est open source. Les outils de document Sont un bonus gratuit et non open source. "... qui clarifie enfin le commentaire de Conversion - collage (imposition) PDF Documents - Overflow de pile :

Toutes les rejets de multivalents liés au site officiel de Sourceforge manquent les outils des outils.

( EDIT: Il semble y avoir une ancienne version multivalente avec les outils incluses, voir le lien SO; mais comme il ressemble quelque peu à ce que Abandonware, je préfère ne pas utiliser IT )

  • Enfin, j'aimerais éviter les outils essentiellement des fronts pour la latex comme PDFJAM

Ainsi, existe-t-il des options pour un tel outil de ligne de commande de scission PDF sous Linux?

12
sdaau

Je trouve PDFSeparate très pratique pour diviser les gammes en pages individuelles. Cette commande extraire des pages 1 à 5 de input.pdf dans les fichiers nommés output-page1.pdf, output-page2.pdf, ...

pdfseparate -f 1 -l 5 input.pdf output-page%d.pdf

Si vous souhaitez les recombiner dans les gammes de page, par exemple les pages 1 à 3 dans un document et les pages 4-5 dans une autre, vous pouvez utiliser le programme compagnon, PDFunite, comme suit:

pdfunite output-page1.pdf output-page2.pdf output-page3.pdf final-pages1-3.pdf
pdfunite output-page4.pdf output-page5.pdf final-pages4-5.pdf

Je crois que les outils que les outils font partie du pogleur et peuvent déjà être installés sur votre système.

18
JoshOrndorff

Je vais mettre cela comme une réponse, afin de ne pas obstruer la question: voici un lien associé sur UNIX.SE:

... et la réponse acceptée utilise un Python Script avec pydf (mais cette réponse implémente une scission d'une page en deux - et ce script doit donc être modifié Pour les gammes de page, car il fonctionne comme demandé dans OP).

Edit: Je viens de trouver ceci: Stapler - A python utilitaire pour manipulation PDF Docs basé sur PYPDF (page 3)/contributions de la Communauté/Arch Les forums Linux ; qui est apparemment " ne petite utilité utilisant la bibliothèque PYPDF pour fournir une alternative (un peu) plus claire à la PDFTK " (Notez que la liste de diffusion note quelques problèmes, toutefois)...

4
sdaau

L'utilisation de PDFTK 2.02 a travaillé pour moi sur Debian, mais je pense que cela devrait fonctionner pour vous aussi.

pdftk input.pdf cat 2-4 output out1.pdf

Pour un cas général où vous devez diviser un seul PDF en plusieurs fichiers, je n'ai pas pu trouver de manière avec PDFTK, donc j'utilise un script Bash.