J'ai un fichier CSV et je souhaite comprendre son encodage. Existe-t-il une option de menu dans Microsoft Excel qui puisse m'aider à le détecter?
OU dois-je utiliser des langages de programmation tels que C # ou PHP pour le déduire.
Vous pouvez simplement ouvrir le fichier en utilisant le Bloc-notes, puis allez dans Fichier -> Enregistrer sous. À côté du bouton Enregistrer, il y aura un menu déroulant d’encodage et l’encodage actuel du fichier y sera sélectionné.
Sur les systèmes Linux, vous pouvez utiliser la commande file . Cela donnera le bon encodage
Échantillon:
file blah.csv
Sortie:
blah.csv: ISO-8859 text, with very long lines
Si vous utilisez Python, utilisez simplement une fonction print () pour vérifier l’encodage d’un fichier csv. Par exemple:
with open('file_name.csv') as f:
print(f)
La sortie ressemble à ceci:
<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>
Utilisez chardet https://github.com/chardet/chardet (la documentation est courte et facile à lire).
Installez python, puis pip install chardet, utilisez enfin la commande en ligne de commande.
J'ai testé sous GB2312 et c'est assez précis. (Assurez-vous que vous avez au moins quelques caractères, un échantillon avec un seul caractère peut échouer facilement).
file
n'est pas fiable, comme vous pouvez le voir.