Je rencontre un problème lors de la conversion de PDF en images à l'aide d'ImageMagick ou de Ghostscript. Tous les caractères accentués disparaissent de l'image convertie. J'ai trouvé quelques personnes qui avaient le même problème et qui, apparemment, mettaient à jour le paquet imagemagick et ghostcript l'ont corrigé, mais pas pour moi.
J'utilise ce fichier PDF sur tous les tests que j'ai effectués: https://www.dropbox.com/s/3gso0sw1e1n8f9r/error-with-accents.pdf?dl=
J'ai un serveur Ubuntu 14.04.2 LTS sur Azure sur lequel j'ai besoin d'ImageMagick pour fonctionner. Parmi les dépôts officiels, j'ai ImageMagick 6.7.7 et Ghostscript 9.10. Plus tard, j'ai essayé de les mettre à niveau afin de résoudre mon problème. Maintenant, j'ai aussi ImageMagick 6.8.9-10 qui s'exécute sur le dossier /opt/imagemagick-6.8
et j'ai ajouté le référentiel 15.04 d'Ubuntu afin d'installer Ghostscript 9.15 directement via apt-get. Aucune de ces solutions n'a résolu le problème pour moi.
Voici mes dernières tentatives sur le serveur Ubuntu 14.04:
$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 14.04.2 LTS
Release: 14.04
Codename: trusty
$ /opt/imagemagick-6.8/bin/convert -version
Version: ImageMagick 6.8.9-10 Q16 x86_64 2015-07-30 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2014 ImageMagick Studio LLC
Features: DPC OpenMP
Delegates: jng jpeg png x xml zlib
$ /opt/imagemagick-6.8/bin/convert -list configure |grep DELEGATES
DELEGATES mpeg jng jpeg png ps x xml zlib
$ /opt/imagemagick-6.8/bin/convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test.jpg
**** Warning: considering '0000000000 XXXXX n' as a free entry.
**** This file had errors that were repaired or ignored.
**** The file was produced by:
**** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
**** Please notify the author of the software that produced this
**** file that it does not conform to Adobe's published PDF
**** specification.
error-with-accents.pdf=>im-test.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit sRGB 172KB 0.440u 0:00.240
$ gs -v
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc. All rights reserved.
$ gs -dBATCH -dNOPAUSE -sDEVICE=jpeg -sOutputFile=gs-test.jpg error-with-accents.pdf
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
**** Warning: considering '0000000000 XXXXX n' as a free entry.
Processing pages 1 through 1.
Page 1
**** This file had errors that were repaired or ignored.
**** The file was produced by:
**** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
**** Please notify the author of the software that produced this
**** file that it does not conform to Adobe's published PDF
**** specification.
$ convert -version
Version: ImageMagick 6.7.7-10 2014-03-06 Q16 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2012 ImageMagick Studio LLC
Features: OpenMP
$ convert -list configure |grep DELEGATES
DELEGATES bzlib djvu fftw fontconfig freetype jbig jpeg jng jp2 lcms2 lqr lzma openexr pango png rsvg tiff x11 xml wmf zlib
$ convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test-6.7.7.jpg
**** Warning: considering '0000000000 XXXXX n' as a free entry.
**** This file had errors that were repaired or ignored.
**** The file was produced by:
**** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
**** Please notify the author of the software that produced this
**** file that it does not conform to Adobe's published PDF
**** specification.
error-with-accents.pdf=>im-test-6.7.7.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit DirectClass 160KB 0.490u 0:00.279
Tous avec les mêmes résultats:
https://www.dropbox.com/s/eob6y234x37s864/gs-test.jpg?dl=
https://www.dropbox.com/s/96z1pkksdn1dpr4/im-test.jpg?dl=
https://www.dropbox.com/s/dev0kbza2c8v2gf/im-test-6.7.7.jpg?dl=
Je suis capable d'exécuter correctement Ghostscript et ImageMagick sur un Mac OS. Et, selon cet article , les versions que j'ai sur Ubuntu devraient fonctionner. Donc, je pense que c'est quelque chose lié aux polices FreeType. Ce que je ne sais rien sur la façon de résoudre ce problème. De l'aide?
Merci à Kurt Pfeifle sur Stackoverflow pour la réponse.
Le problème était la version de Ghostscript installée sur le serveur. Comme la dernière version de Ghostscript sur le référentiel intelligent Ubuntu est 9.15, j'ai téléchargé le fichier officiel paquet binaire pour linux x64 sur le site Web de Ghostscript.
Ensuite, j’ai substitué /usr/bin/gs
_binary à celui contenu dans le paquet et tout a fonctionné correctement. Pas plus de problèmes avec les accents.
J'ai eu le même genre de problèmes lorsque j'essayais d'imprimer un pdf avec des accents. Je suis arrivé à la conclusion que c’était un problème de ghostscript, puisque CUPS l’utilisait pour rasteriser le fichier PDF à travers le filtre gstoraster
. J'ai également réalisé qu'un binaire récent de ghostscript en mode autonome faisait un excellent travail.
MAIS Je ne conseillerais pas de remplacer /usr/bin/gs
car cela pourrait casser certaines dépendances (CUPS par exemple)!
Au lieu de cela, je vous suggère de regarder l'outil pdfimages
de poppler-utils