En utilisant Apache POI
comment convertir MS Word
fichier vers pdf
J'utilise le code suivant mais cela ne fonctionne pas, ce qui donne des erreurs Je suppose que j'importe les mauvaises classes?
import Java.io.File;
import Java.io.FileInputStream;
import Java.io.FileOutputStream;
import Java.io.OutputStream;
import org.Apache.poi.hslf.record.Document;
import org.Apache.poi.hwpf.HWPFDocument;
import org.Apache.poi.hwpf.extractor.WordExtractor;
import org.Apache.poi.hwpf.usermodel.Paragraph;
import org.Apache.poi.hwpf.usermodel.Range;
import org.Apache.poi.poifs.filesystem.POIFSFileSystem;
public class TestCon {
* @param args
public static void main(String[] args) {
// TODO Auto-generated method stub
POIFSFileSystem fs = null;
Document document = new Document();
try {
System.out.println("Starting the test");
fs = new POIFSFileSystem(new FileInputStream("/document/test2.doc"));
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
OutputStream file = new FileOutputStream(new File("/document/test.pdf"));
PdfWriter writer = PdfWriter.getInstance(document, file);
Range range = doc.getRange();
String[] paragraphs = we.getParagraphText();
for (int i = 0; i < paragraphs.length; i++) {
org.Apache.poi.hwpf.usermodel.Paragraph pr = range.getParagraph(i);
// CharacterRun run = pr.getCharacterRun(i);
// run.setBold(true);
// run.setCapitalized(true);
// run.setItalic(true);
paragraphs[i] = paragraphs[i].replaceAll("\\cM?\r?\n", "");
System.out.println("Length:" + paragraphs[i].length());
System.out.println("Paragraph" + i + ": " + paragraphs[i].toString());
// add the paragraph to the document
document.add(new Paragraph(paragraphs[i]));
System.out.println("Document testing completed");
} catch (Exception e) {
System.out.println("Exception during test");
} finally {
// close the document
Je l'ai résolu
import Java.io.File;
import Java.io.FileInputStream;
import Java.io.FileOutputStream;
import Java.io.OutputStream;
import com.lowagie.text.Document;
import com.lowagie.text.DocumentException;
import com.lowagie.text.Paragraph;
import com.lowagie.text.pdf.PdfWriter;
import org.Apache.poi.hwpf.HWPFDocument;
import org.Apache.poi.hwpf.extractor.WordExtractor;
import org.Apache.poi.hwpf.usermodel.Range;
import org.Apache.poi.poifs.filesystem.POIFSFileSystem;
public class TestCon {
* @param args
public static void main(String[] args) {
// TODO Auto-generated method stub
POIFSFileSystem fs = null;
Document document = new Document();
try {
System.out.println("Starting the test");
fs = new POIFSFileSystem(new FileInputStream("D:/Resume.doc"));
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
OutputStream file = new FileOutputStream(new File("D:/test.pdf"));
PdfWriter writer = PdfWriter.getInstance(document, file);
Range range = doc.getRange();
String[] paragraphs = we.getParagraphText();
for (int i = 0; i < paragraphs.length; i++) {
org.Apache.poi.hwpf.usermodel.Paragraph pr = range.getParagraph(i);
// CharacterRun run = pr.getCharacterRun(i);
// run.setBold(true);
// run.setCapitalized(true);
// run.setItalic(true);
paragraphs[i] = paragraphs[i].replaceAll("\\cM?\r?\n", "");
System.out.println("Length:" + paragraphs[i].length());
System.out.println("Paragraph" + i + ": " + paragraphs[i].toString());
// add the paragraph to the document
document.add(new Paragraph(paragraphs[i]));
System.out.println("Document testing completed");
} catch (Exception e) {
System.out.println("Exception during test");
} finally {
// close the document
Cela a fonctionné pour moi: -
package pdf;
import Java.io.File;
import Java.io.FileInputStream;
import Java.io.FileOutputStream;
import Java.io.OutputStream;
import org.Apache.poi.xwpf.converter.pdf.PdfConverter;
import org.Apache.poi.xwpf.converter.pdf.PdfOptions;
import org.Apache.poi.xwpf.usermodel.XWPFDocument;
public class PDF {
public static void main(String[] args) throws Exception {
String inputFile="D:/TEST.docx";
String outputFile="D:/TEST.pdf";
if (args != null && args.length == 2) {
System.out.println("inputFile:" + inputFile + ",outputFile:"+ outputFile);
FileInputStream in=new FileInputStream(inputFile);
XWPFDocument document=new XWPFDocument(in);
File outFile=new File(outputFile);
OutputStream out=new FileOutputStream(outFile);
PdfOptions options=null;
Le code ci-dessous a fonctionné pour moi:
Public class DocToPdfConverter{
public static void main(String[] args) {
String k=null;
OutputStream fileForPdf =null;
try {
String fileName="/document/test2.doc";
//Below Code is for .doc file
HWPFDocument doc = new HWPFDocument(new FileInputStream(
WordExtractor we=new WordExtractor(doc);
k = we.getText();
fileForPdf = new FileOutputStream(new File(
//Below Code for
else if(fileName.endsWith(".docx"))
XWPFDocument docx = new XWPFDocument(new FileInputStream(
// using XWPFWordExtractor Class
XWPFWordExtractor we = new XWPFWordExtractor(docx);
k = we.getText();
fileForPdf = new FileOutputStream(new File(
Document document = new Document();
PdfWriter.getInstance(document, fileForPdf);
document.add(new Paragraph(k));
} catch (Exception e) {
En guise de remarque, il est également possible de lire du contenu à la volée directement à partir d'un flux de contenu Word/Excel au lieu de le lire à partir du système de fichiers et de le sérialiser sur le disque, par exemple lors de la récupération de contenu à partir de référentiels CMIS:
par exemple.
//HWPFDocument docx = new HWPFDocument(fs);
HWPFDocument docx = new HWPFDocument(doc.getContentStream().getStream());
(doc est de type org.Apache.chemistry.opencmis.client.api.Document
et dans ce cas j'ai adapté votre code pour récupérer un fichier Word à partir d'un référentiel Alfresco au moyen d'opencmis et l'ai transformé en PDF)
Il y a plusieurs étapes ici:
Je ne sais pas si POI fera l'étape 2 pour vous. Je recommanderais autre chose, comme iText.
En plus de la réponse de Kushagra, voici les dépendances Maven mises à jour:
Cela sauve ma journée, je charge le fichier docx à partir d'une URL et le convertis en pdf:
public String wordToPDFPOI(String url) throws Exception {
InputStream doc = new URL(url).openStream();
ByteArrayOutputStream baos = new ByteArrayOutputStream();
XWPFDocument document = new XWPFDocument(doc);
PdfOptions options = PdfOptions.create();
PdfConverter.getInstance().convert(document, baos, options);
String base64_encoded = Base64.encodeBytes(baos.toByteArray());
return base64_encoded;