Supposons que j'ai un PDF et que je souhaite obtenir toutes les métadonnées disponibles pour ce PDF. Quel utilitaire dois-je utiliser?
Je trouve que l'information que je suis généralement le plus intéressé à connaître est le format de papier , quelque chose que PDF ne rapportent généralement pas. Par exemple, le PDF format lettre, légal, A4 ou autre? Mais les autres informations disponibles peuvent également être intéressantes.
Un des outils canoniques pour cela est pdfinfo
, qui vient avec xpdf, si je me souviens bien. Exemple de sortie:
[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator: TeX
Producer: pdfTeX-1.40.14
CreationDate: Sun May 18 09:53:06 2014
ModDate: Sun May 18 09:53:06 2014
Tagged: no
Form: none
Pages: 1
Encrypted: no
Page size: 595.276 x 841.89 pts (A4)
Page rot: 0
File size: 19700 bytes
Optimized: no
PDF version: 1.5
Un autre utilitaire qui mérite d'être étudié est exiftool . Ce n'est peut-être pas le bon outil dans votre cas spécifique car il ne fournit aucune information sur la géométrie du document, mais en général c'est probablement l'outil le plus complet pour inspecter les métadonnées PDF .
Voici un exemple de commande qui imprimera toutes les méta-informations disponibles (-a
), triés par groupes (-G1
):
exiftool -a -G1 "$File"
La documentation officielle offre un aperçu des balises liées au PDF prises en charge:
Vous pouvez installer exiftool sur Debian/Ubuntu avec:
Sudo apt-get install libimage-exiftool-Perl
Si vous êtes plutôt du côté GUI, vous pouvez essayer mon projet PDFMtEd essayer. C'est un ensemble d'outils qui servent d'interface graphique pour exiftool et permettent de visualiser et de modifier les métadonnées PDF.
Voici quelques captures d'écran: