Ce qui doit arriver à une chaîne en utilisant Java pour être un équivalent de vi
s
:set nobomb
Supposons que BOM
provient du fichier que je lis.
Java ne gère pas correctement la nomenclature. En fait Java gère une nomenclature comme tous les autres caractères.
Trouvé ceci:
http://www.rgagnon.com/javadetails/Java-handle-utf8-file-with-bom.html
public static final String UTF8_BOM = "\uFEFF";
private static String removeUTF8BOM(String s) {
if (s.startsWith(UTF8_BOM)) {
s = s.substring(1);
}
return s;
}
Peut-être que j'utiliserais Apache IO à la place:
http://commons.Apache.org/proper/commons-io/apidocs/org/Apache/commons/io/input/BOMInputStream.html
Pour UTF-8, la nomenclature est: 0xEF, 0xBB, 0xBF