web-dev-qa-db-fra.com

read.csv () avec encodage UTF-8

J'essaie de lire les données d'un fichier csv et de spécifier l'encodage des caractères en UTF-8. De la lecture des instructions? Read.csv (), il semble que fileEncoding défini égal à UTF-8 devrait accomplir cela, cependant, je ne vois pas cela lors de la vérification. Existe-t-il un meilleur moyen de spécifier le codage des chaînes de caractères en UTF-8 lors de l'importation des données?

Exemples de données:

Téléchargez des exemples de données ici

fruit<- read.csv("fruit.csv", header = TRUE, fileEncoding = "UTF-8")
fruit[] <- lapply(fruit, as.character)
Encoding(fruit$Fruit)

La sortie est "inconnue" mais je m'attendrais à ce que ce soit "UTF-8". Quelle est la meilleure façon de s'assurer que tous les caractères importés sont en UTF-8? Je vous remercie.

6
Rob.C
fruit       <- read.csv("fruit.csv", header = TRUE)
fruit[]     <- lapply(fruit, as.character)
fruit$Fruit <- paste0(fruit$Fruit, "\xfcmlaut") # Get non-ASCII char and jam it in!
Encoding(fruit$Fruit)

[1] "latin1" "latin1" "latin1"

fruit$Fruit <- enc2utf8(fruit$Fruit)
Encoding(fruit$Fruit)

[1] "UTF-8" "UTF-8" "UTF-8"

5
Hack-R