web-dev-qa-db-fra.com

Comment supprimer un filigrane d'un fichier PDF à l'aide de pdftk?

Je dois supprimer un filigrane de messagerie stupide qui s'étend sur toutes les pages d'un livre du domaine public. J'ai consulté la page de manuel de pdftk et quelques exemples, mais je ne peux toujours pas comprendre comment supprimer les filigranes. J'apprécie vos conseils.

32
hnns

très simplement tâche à accomplir:

utiliser sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

mais, après, assurez-vous de réparer la sortie résultante pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tout en une commande:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

les filigranes de texte ne sont rien d'autre qu'un texte entre deux balises à l'intérieur du code pdf compressé

34
Dingo

Juste un petit ajout à la réponse de Dingo, car cela ne fonctionnait pas pour moi:

Je devais d'abord décompresser le document PDF pour pouvoir trouver le filigrane et le remplacer par sed. La première étape consiste à décompresser le document PDF à l'aide de pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

maintenant, le uncompressed.pdf peut être utilisé comme dans la réponse de Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

J'ai ensuite réparé et recompressé le document:

pdftk unwatermarked.pdf output fixed.pdf compress
46
Philippe