web-dev-qa-db-fra.com

Comment vérifier l'encodage d'un fichier CSV

J'ai un fichier CSV et je souhaite comprendre son encodage. Existe-t-il une option de menu dans Microsoft Excel qui puisse m'aider à le détecter?

OU dois-je utiliser des langages de programmation tels que C # ou PHP pour le déduire.

35
Vipul

Vous pouvez simplement ouvrir le fichier en utilisant le Bloc-notes, puis allez dans Fichier -> Enregistrer sous. À côté du bouton Enregistrer, il y aura un menu déroulant d’encodage et l’encodage actuel du fichier y sera sélectionné.

40
CamW

Sur les systèmes Linux, vous pouvez utiliser la commande file . Cela donnera le bon encodage

Échantillon:

file blah.csv

Sortie:

blah.csv: ISO-8859 text, with very long lines
26
Jitender Kumar

Si vous utilisez Python, utilisez simplement une fonction print () pour vérifier l’encodage d’un fichier csv. Par exemple:

with open('file_name.csv') as f:
    print(f)

La sortie ressemble à ceci:

<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>
14
Alineat

Utilisez chardet https://github.com/chardet/chardet (la documentation est courte et facile à lire).

Installez python, puis pip install chardet, utilisez enfin la commande en ligne de commande.

J'ai testé sous GB2312 et c'est assez précis. (Assurez-vous que vous avez au moins quelques caractères, un échantillon avec un seul caractère peut échouer facilement).

file n'est pas fiable, comme vous pouvez le voir.

enter image description here

2
Rick