Je dois supprimer un filigrane de messagerie stupide qui s'étend sur toutes les pages d'un livre du domaine public. J'ai consulté la page de manuel de pdftk et quelques exemples, mais je ne peux toujours pas comprendre comment supprimer les filigranes. J'apprécie vos conseils.
très simplement tâche à accomplir:
utiliser sed:
sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf
mais, après, assurez-vous de réparer la sortie résultante pdf
pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf
tout en une commande:
sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf
les filigranes de texte ne sont rien d'autre qu'un texte entre deux balises à l'intérieur du code pdf compressé
Juste un petit ajout à la réponse de Dingo, car cela ne fonctionnait pas pour moi:
Je devais d'abord décompresser le document PDF pour pouvoir trouver le filigrane et le remplacer par sed
. La première étape consiste à décompresser le document PDF à l'aide de pdftk
:
pdftk original.pdf output uncompressed.pdf uncompress
maintenant, le uncompressed.pdf
peut être utilisé comme dans la réponse de Dingo:
sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf
J'ai ensuite réparé et recompressé le document:
pdftk unwatermarked.pdf output fixed.pdf compress