web-dev-qa-db-fra.com

Regex PDF recherche?

Je suis un ingénieur en électronique et je consulte régulièrement les schémas PDF. Souvent, je rencontre le scénario dans lequel je souhaite rechercher un composant dans le schéma, par exemple. "R1"

Le problème est que la recherche de "R1" correspond également à tous les R [dizaines] et R [centaines] du schéma. Je souhaite donc pouvoir utiliser une expression rationnelle dans ma recherche ou au moins avoir un contrôle plus strict de la recherche (par exemple, rechercher le mot entier uniquement).

Quelqu'un at-il trouvé ici un bon outil PDF sur Ubuntu qui prend en charge ces fonctionnalités?

2
Brian J Hoskins

Installer pdfgrep :

Sudo apt-get install pdfgrep

Ensuite, utilisez l’option -C et les limites de Word correspondent:

pdfgrep -C 0 '\<Word\>' file.pdf

ou utilisez \b...\b au lieu de \<...\>.

Voir son man pdfgrep

-C, --context NUM
      Print at most NUM characters of context around each match.

J'ai googlé et trouvé JPedal (essai de 30 jours) . Téléchargez-le et ouvrez-le via la ligne de commande à l'aide de la commande suivante:

Java -jar jpedal-trial.jar

Maintenant, appuyez sur Ctrl+F, tapez le mot que vous souhaitez rechercher et cochez la case "Rechercher uniquement les mots entiers" dans l’icône flèche vers le bas (enter image description here) pour rechercher le mot entier.

enter image description here

2
αғsнιη

Si vous voulez créer un index de vos documents, vous pouvez utiliser Recoll , qui est un moteur de recherche complet. Pour les captures d'écran et les instructions d'installation, veuillez regarder cette réponse .

Les recherches de rappel sont construites en utilisant un langage de requête puissant qui prend en charge caractères génériques et modificateurs (par exemple proximité et relâché ).

Par exemple, la requête "R1"l ne produira que des résultats complets. Cela est dû au fait que le modificateur l désactive l’accrochage. (Dans cet exemple spécifique, vous n’auriez même pas besoin du modificateur, car Recoll ne développe pas les séquences de nombres par défaut).

1
Glutanimate

Si le problème est simplement de limiter la recherche à des mots entiers, c'est assez simple. Ajoutez simplement des espaces avant et après votre chaîne de recherche, comme ceci: " R1 ". J'utilise cette astuce dans Evince tout le temps.

0
Brian Z