web-dev-qa-db-fra.com

Comment convertir un fichier HTML à word?

J'ai une exigence où j'ai besoin d'enregistrer des documents HTML en mémoire en tant que fichiers Word .DOC.

Quelqu'un peut-il me donner des liens vers des bibliothèques fermées et open source que je peux utiliser pour ce faire?

De plus, je devrais éditer cette question pour ajouter la langue que j'utilise afin d'affiner les choix.

Merci!

35
Mask

Essayez d'utiliser pandoc

pandoc -f html -t docx -o output.docx input.html

Si le format d'entrée ou de sortie n'est pas spécifié explicitement, pandoc tentera de le deviner à partir des extensions des noms de fichiers d'entrée et de sortie.
- manuel pandoc

Vous pouvez donc même utiliser

pandoc -o output.docx input.html
30
Jan

juste après cela en tête de votre page php. avant tout code à ce sujet devrait être le code supérieur.

<?php
header("Content-Type: application/vnd.ms-Word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc");

?>

cela convertira tout le code HTML en MSWORD, vous pouvez maintenant le personnaliser en fonction des besoins de votre client.

5
SAR

En faisant cela, j'ai trouvé plus facile de:

  1. Visitez la page dans un navigateur Web
  2. Enregistrez la page à l'aide du navigateur Web avec l'extension .htm (et peut-être un dossier avec des fichiers de support)
  3. Démarrez Word et ouvrez le fichier htm enregistré (Word l'ouvrira correctement)
  4. Apportez des modifications si nécessaire
  5. Sélectionnez Enregistrer sous, puis choisissez l'extension que vous souhaitez doc, docx, etc.
4
SnapShot

Une bonne option consiste à utiliser une API comme Docverter . Docverter vous permettra de convertir HTML en PDF ou DOCX en utilisant une API.

4
user1980965

Autres alternatives de simplement renommer le fichier en .doc .....

http://msdn.Microsoft.com/en-us/library/Microsoft.office.interop.Word (office.11) .aspx

Ici c'est un bon endroit pour commencer. Vous pouvez également essayer d'utiliser ce fichier Office Open XML.

http://www.ecma-international.org/publications/standards/Ecma-376.htm

1
sleath