web-dev-qa-db-fra.com

Service Web permettant de convertir les formats de fichiers Microsoft Office (doc, docx, ppt, etc.) en texte brut?

Contexte plus large: nous travaillons sur le moteur de recherche d'un portail Intranet, qui doit pouvoir rechercher dans TOUS les types de bureaux: .doc, .docx, .xls, .xlsx, .ppt et .pptx. La recherche étant également déjà en place, nous avons implémenté l'indexeur à l'aide de la bureautique; Cependant, le client est préoccupé par le fait qu'il s'agit d'un élément, sujet à erreurs, et de deux, non recommandé par Microsoft (et non couvert par la licence).

J'ai lu les réponses précédentes à cet égard sur SO, mais cela nous obligerait à intégrer un très grand nombre de bibliothèques distinctes pour couvrir tous les bords, ce que nous n'avons pas la ressource à faire.

Par conséquent, nous recherchons un service Web simple, auquel nous pouvons soumettre n’importe lequel de ces documents, et qui renverrait un texte simple et clair (ou HTML, ou même PDF - nous avons des analyseurs syntaxiques pour les deux) sortie.

Existe-t-il de tels services (gratuits ou payants) couvrant tous les formats de fichiers ci-dessus?

1
Csaba

Online PDF Converter semble être ce que vous recherchez. Vous pouvez convertir gratuitement (et envoyer le document converti à un courrier électronique) ou acheter un adhésion .

1
TookTheRook

Saaspose est la solution de votre problème. En utilisant cette application gratuite, vous pouvez non seulement convertir votre document en plusieurs formats, mais également créer votre document, qu'il s'agisse de son document Word ou PDF. gratter en ligne.

1
zarfishan