Hé, depuis un bon moment maintenant, je cherche une visionneuse PDF pour la ligne de commande.
Comme j'aime travailler sans X sous Linux, et travailler souvent sur une machine distante, j'aimerais avoir un outil pour lire les pdfs. Il y a beaucoup de très bons programmes graphiques (evince, okular, acroread, ...) pour faire le travail, donc je me suis dit qu'il devrait y avoir au moins un outil en mode texte décent. Mais je n'en connais même pas un de merde!
Actuellement, je démarre X uniquement pour lire les fichiers PDF, ou j'utilise pdftohtml + lynx. Cependant, ce dernier ne produit pas une très bonne sortie, et la plupart des documents sont tout simplement illisibles, surtout s'ils contiennent une formule mathématique.
Google est plein de gens qui disent que ce n'est pas possible ou qui suggèrent la version pdftohtml.
Je me rends compte que ce n'est pas exactement une question de programmation, mais j'envisage actuellement de démarrer un projet pour mettre en œuvre un tel programme, à moins qu'il n'y en ait déjà un bon.
Merci pour toutes suggestions.
Salut, je pense que vous n'avez pas besoin d'écrire un programme à votre intention, je veux dire lire un fichier pdf en mode console parce que la commande "moins" le fait déjà pour vous. Alors utilisez-le et profitez-en.
moins "le nom du fichier pdf"
Ok, vous avez demandé à en savoir même des "merdiques". En voici deux (décidez-vous de leur merde respective):
Premièrement: Ghostscript'stxtwrite
périphérique de sortie
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
Deuxième: XPDF'spdftotext
Utilitaire CLI (meilleur que Ghostscript):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
Cela affichera la plage de pages 13 (fpremière page) à 17 (last page), conservez la présentation d'un fichier protégé par un double mot de passe nommé PDF (en utilisant les mots de passe utilisateur et propriétaire secret et supersecret ), avec la convention Unix EOL, mais sans insérer de sauts de page entre les pages PDF, redirigées vers moins ...
pdftotext -h
affiche toutes les options de ligne de commande disponibles.
Bien sûr, les deux outils ne fonctionnent que pour les parties texte des PDF (s’ils en ont). Oh, et la formule mathématique ne fonctionnera pas trop bien ... ;-)
Edit: J'ai mal tapé la commande ci-dessus (en utilisant à l'origine pdftops
au lieu de pdftotext
).
fbgs pourrait peut-être faire l'affaire.
Soit dit en passant, je suis toujours dans la même situation, et j'utilise mc (midnight commander) qui gère très bien le texte pdf ... Il suffit de visualiser le fichier (F3) dans mc
Cela ne fonctionnerait que si votre PDF est structuré, c'est-à-dire qu'il s'agit d'un PDF tagué document.
Ceci est nécessaire pour obtenir l'ordre de lecture correct des objets texte dans le document.
Tagged PDF permettent également de redistribuer le document même si je ne connais aucun outil faisant cela avec une sortie en ligne de commande.