web-dev-qa-db-fra.com

Comment convertir un fichier pdf en fichier odt?

Je souhaite convertir un fichier .pdf en un fichier .odt afin de pouvoir le convertir davantage en un fichier .doc. Existe-t-il un logiciel/script capable de le faire? J'ai essayé de copier le contenu du fichier .pdf et de le coller dans liberoffice writer, le formatage n'est pas préservé.

Le document étant confidentiel, je préférerais ne pas utiliser de service en ligne pour la conversion.

Toute aide est grandement appréciée.

32
Ankit

L’absence d’un convertisseur gratuit PDF vers ODT me gênait également. Je n'avais même pas besoin de quelque chose de compliqué. Juste un outil qui génère des fichiers ODT que je peux ensuite annoter dans LibreOffice (par exemple, pour remplir des formulaires).

Je sais comment procéder manuellement en convertissant le document PDF en fichiers graphiques, puis en les important dans LibreOffice, mais la tâche est fastidieuse.

J'ai donc finalement écrit un petit script Shell rapide qui effectue automatiquement toutes les étapes requises. Vous pouvez le trouver sur https://github.com/gutschke/pdf2odt

Il peut prendre un nombre illimité de PDF et de fichiers image en entrée et génère un fichier ODT pouvant être ouvert et modifié dans LibreOffice. Les images apparaissent en fond de page, vous pouvez donc les écrire librement. Chaque image est associée à son propre style de page. N'oubliez pas cela lors de l'insertion de sauts de page et ajustez le style de page si nécessaire.

J'ai testé le script sous Linux et Mac. Étant donné qu'il ne nécessite qu'une poignée d'outils raisonnablement standard, il devrait être assez portable.

15
gutschke

Vous pouvez jeter un oeil à PDF Utilities (poppler-utils via Synaptic ou apt-get) qui inclut pdftotext:

Poppler est une bibliothèque de rendu PDF basée sur le visualiseur Xpdf PDF.

Ce paquet contient des utilitaires de ligne de commande (basés sur Poppler) permettant d’obtenir des informations sur les documents PDF, de les convertir en d’autres formats ou de les manipuler:
* pdfdetach - répertorie ou extrait des fichiers incorporés (pièces jointes)
* pdffonts - analyseur de polices
* pdfimages - extracteur d'images
* pdfinfo - informations sur le document
* pdfseparate - outil d’extraction de pages
* pdftocairo - PDF au convertisseur PNG/JPEG/PDF/PS/EPS/SVG utilisant Cairo
* pdftohtml - PDF convertisseur HTML
* pdftoppm - PDF au convertisseur d'image PPM/PNG/JPEG
* pdftops - PDF au convertisseur PostScript (PS)
* pdftotext - extraction de texte
* pdfunite - outil de fusion de documents

Bien sûr, le succès dépendra de la manière dont le fichier pdf a été généré. Si vous obtenez ce que vous voulez sous forme de fichier texte, vous pouvez alors sauvegarder cela en tant que fichier .odt.

Edit: J'ai oublié de fournir la source de la citation. C'est à partir de l'onglet Description dans Synaptic pour PDF Utilities (based on Poppler).

13
user25656

LibreOffice est capable d'importer des fichiers .pdf. Ouvrez-le simplement dans une version actuelle de LibreOffice pour obtenir de meilleurs résultats. Cependant, le document sera ouvert en tant que dessin et vous ne pourrez le convertir que dans l'un des formats d'image pris en charge, et non en tant que document Writer.

Naturellement, tout le formatage n'est pas préservé, mais au moins certains.

10
bender

Essayez Calibre. Il convertit en HTML, puis dans d'autres formats. Il a fait un très bon travail sur un fichier volumineux (183 pages) que j'aurais sinon dû imprimer.

Dans mon cas, je l'ai converti en epub, mais pour le plaisir, je l'ai converti en un fichier .docx qui s'est avéré très efficace.

3
Christopher

Si le paquet poppler-utils est installé, le script Nautilus ci-dessous ( être placé dans le dossier ~/.gnome2/nautilus-scripts en tant que fichier exécutable) aidera à convertir le fichier PDF en HTML (l'option "-i" peut également être supprimée pour inclure des images), qui peut ensuite être ouvert avec LibreOffice Writer et enregistré en tant que ODT bien que le succès de la conversion de formatage dépende beaucoup de la manière dont PDF est créé.

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym

3
Sadi