J'ai plusieurs fichiers jpeg dans un répertoire, et je veux les convertir en pdf et les concaténer ensemble pour créer un document. Comment ceci peut être fait? Je préférerais la ligne de commande, car ce sera plus rapide.
Dans le package imagemagick
, utilisez la commande convert
:
convert *.jpg pictures.pdf
Vous obtiendrez un seul fichier PDF contenant tous les jpg du dossier actuel.
Installez IM avec:
Sudo apt-get install imagemagick
source: stackoverflow
Éditer: Notez que les images ne seront pas dans un ordre spécifique si elles ne sont pas numérotées. si vous en avez 10 ou plus, vous devez les nommer en terminant filename01.jpg ... filename99.jpg etc. Les zéros de gauche sont requis pour un ordre correct. Si vous avez 100 ou plus, 001 ... 999.
convert `ls -1v` file.pdf
Travaillé pour moi (MAIS avertissement! Désactive la compression et le résultat PDF sera énorme!):
convert page1.jpg page2.jpg +compress file.pdf
ou même:
convert -rotate 90 page\*.jpg +compress file.pdf
Sur ubuntuforums.org, le +compress
l’aide à ne pas se bloquer. NOTE: le + compresse désactive la compression. La machine sur laquelle je travaillais à l'époque semblait être suspendue "pour toujours" (je n'ai pas attendu longtemps pour le savoir) sans l'option + compress. Votre kilométrage peut varier un peu! RTFM on imagemagick.org option -compress , peut-être expérimenter avec -compress <type> si vous avez des problèmes de compression lente/blocage pour trouver ce qui fonctionnera pour vous.
Malheureusement convert
change la qualité de l'image avant de "l'insérer" dans le fichier PDF; il est donc préférable de mettre l'original jpg
dans le fichier PDF, il est donc nécessaire d'utiliser img2pdf
, je l'utilise commandes:
1) Ceci pour créer un fichier pdf
à partir de chaque image jpg
sans perte de résolution ni de qualité:
ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
2) Ceci pour concaténer les pages pdf
en une seule:
pdftk *.pdf cat output combined.pdf
3) Enfin, j’ajoute un calque de texte OCRed qui ne modifie pas la qualité de l’analyse dans les fichiers PDF, de sorte qu’il peut être interrogé:
pypdfocr combined.pdf
Alternativement à pypdfocr
:
ocrmypdf combined.pdf combined_ocr.pdf
Ouvrez un fichier jpg ou png avec LibreOffice Writer et exportez-le au format PDF.
J'espère que c'est un moyen simple d'exporter du pdf.
La solution suivante s'appuie également sur la variable convert
d'ImageMagick, mais elle est un peu plus sophistiquée car:
pdfimages -j file.pdf img
.) ne fonctionne qu'avec PNG - voir le commentaire de @dma_k ci-dessous.Instructions:
Concaténez tous vos fichiers d'une seule page PDF avec PDFtk comme suit:
pdftk *.pdf cat output out.pdf