web-dev-qa-db-fra.com

Comment ajouter une nomenclature UTF-8 en java

J'ai une procédure stockée Java qui récupère l'enregistrement de la table à l'aide de l'objet Resultset et crée un fichier CSV.

BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);
ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();
zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
    out.print("\"" + rs.getString(i) + "\"");
    out.print(",");
}
out.flush();
zipOut.closeEntry();
zipOut.close();
retBLOB.close();
return retBLOB;

Mais le fichier csv généré ne montre pas le caractère allemand correct. La base de données Oracle a également une valeur NLS_CHARACTERSET UTF8.

Veuillez suggérer.

18
Fadd

Pour écrire une nomenclature dans UTF-8, vous avez besoin de PrintStream.print(), pas PrintStream.write().

De même, si vous souhaitez avoir une nomenclature dans votre fichier csv, je suppose que vous devez imprimer une nomenclature après putNextEntry().

8
axtavt
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);

Cela écrit correctement 0xEF 0xBB 0xBF dans le fichier, qui est la représentation UTF-8 de la nomenclature.

57
astro

Juste au cas où les personnes sont utilisent PrintStreams, vous devez le faire un peu différemment. Alors qu'une Writer fera de la magie pour convertir un seul octet en 3 octets, une PrintStream requiert les 3 octets de la nomenclature UTF-8 individuellement:

    // Print utf-8 BOM
    PrintStream out = System.out;
    out.write('\ufeef'); // emits 0xef
    out.write('\ufebb'); // emits 0xbb
    out.write('\ufebf'); // emits 0xbf

Alternativement, vous pouvez utiliser les valeurs hexadécimales directement pour ceux-ci:

    PrintStream out = System.out;
    out.write(0xef); // emits 0xef
    out.write(0xbb); // emits 0xbb
    out.write(0xbf); // emits 0xbf
7

Je pense que out.write('\ufeff'); devrait en fait être out.print('\ufeff');

Selon le javadoc , la méthode write(int) écrit en fait un octet ... sans codage de caractères. Donc, out.write('\ufeff'); écrit l'octet 0xff. En revanche, la méthode print(char) code le caractère sous la forme d'un ou de plusieurs octets à l'aide du codage du flux, puis écrit ces octets.

7
Stephen C

Dans mon cas, cela fonctionne avec le code:

PrintWriter out = new PrintWriter(new File(filePath), "UTF-8");
out.write(csvContent);
out.flush();
out.close();
0
Rocio