web-dev-qa-db-fra.com

Comment supprimer OCR d'un PDF?

Je cherche Google depuis un certain temps mais je ne trouve pas de réponse à ma question.

J'ai des couches indésirables d'OCR dans un document que j'ai récemment numérisé avec Adobe Acrobat. Il n'a pas été correctement ocred, et je tiens à rédiger des informations, mais l'OCR rend les informations souhaitées à être effacées. J'ai converti les fichiers en TIFS, mais j'ai remarqué une perte de qualité (très) significative. J'ai entendu dire que l'impression à un autre PDF conserve le texte ou réduit la qualité de l'image.

J'apprécie toute aide pour résoudre ce problème dès que possible.

Je vous remercie.

14
Sanoo

Je l'ai résolu en exportant vers JPEG, puis de JPEG 'Combinez des fichiers à Acrobat'. Cela provient d'un DOC qui était à l'origine un mot doc et qui avait été converti en PDF. OCR est parti.

1
rando cal

Après beaucoup d'expérimentation, j'ai trouvé que l'impression à Adobe PDF d'Adobe Acrobat imprime le document sans l'OCR et sans perdre la qualité (une résolution imperceptible à première vue en ligne).

Cependant, de nombreux sites affirment que cela ne fonctionne pas. J'ai également essayé les autres imprimantes telles que Foxit Reader et OneNote, mais la qualité a été réduite. JPEG était aussi la même chose.

N'oubliez pas que votre kilométrage peut varier.

Remarque: je quitte ce fil marqué comme sans réponse dans l'espoir de trouver une meilleure réponse que la mienne.

1
Sanoo

Dans Acrobat X, sous protection, il existe un bouton de document désinfectant qui supprime tout, mais ce qui peut être vu (y compris la couche de texte OCR'D), convertir le document en une carte de bits aplatie.

1
Dave

À Acrobat Pro: Utilisez "Supprimer les informations cachées" (sous "protection"). Sélectionner tout, exécuter, OCR est parti

1
jazzzz