web-dev-qa-db-fra.com

Comment rechercher dans les PDF à l'aide d'expressions régulières?

Habituellement, j'utilise NotePad ++ pour rechercher dans des fichiers à l'aide d'expressions régulières. Aujourd'hui, je me demande s'il y a un programme PDF qui fait la même chose pour les PDF. Bien sûr, je pourrais convertir le PDF _ _ au texte et utiliser le bloc-notes ++ mais y a-t-il un moyen plus facile sans convertir?

15
Michael S.

plusieurs options:

9
akira
  1. L'agent RANSACACK est gratuit (LITE) et Supports PDF au fur et à mesure que ses notes de publication confirment.
  2. PowerGrep est un produit commercial.

Comme vous l'avez dit, l'alternative évidente consiste à convertir les PDF en texte. Une façon pour un programmeur de définir cela pour le traitement en vrac consiste à utiliser le Python pack pdfminer. Agent RANSACACK utilise "PDFTOTEXT" à partir du projet XPDF (et vous pouvez aussi).

4
minopret