web-dev-qa-db-fra.com

Comment concaténer des facteurs, sans qu'ils soient convertis au niveau entier?

J'ai été surpris de voir que R contraindra les facteurs en un nombre lors de la concaténation de vecteurs. Cela se produit même lorsque les niveaux sont les mêmes. Par exemple:

> facs <- as.factor(c("i", "want", "to", "be", "a", "factor", "not", "an", "integer"))
> facs
[1] i       want    to      be      a       factor  not     an      integer
Levels: a an be factor i integer not to want
> c(facs[1 : 3], facs[4 : 5])
[1] 5 9 8 3 1

quelle est la manière idiomatique de faire cela dans R (dans mon cas, ces vecteurs peuvent être assez gros)? Je vous remercie.

33
Keith

À partir de la liste de diffusion R :

unlist(list(facs[1 : 3], facs[4 : 5]))

Pour 'cbind' facteurs, faire

data.frame(facs[1 : 3], facs[4 : 5])
30
fgregg

Une autre solution consiste à convertir le facteur en vecteur de caractère, puis à reconvertir lorsque vous êtes en train de concaténer.

cfacs <- as.character(facs)
x <- c(cfacs[1:3], cfacs[4:5]) 

# Now choose between
factor(x)
# and
factor(x, levels = levels(facs))
8
Richie Cotton

Wow, je n'ai jamais réalisé que c'était ce qui se passait. Voici une solution de contournement:

x <- c(facs[1 : 3], facs[4 : 5]) 
x <- factor(x, levels=1:nlevels(facs), labels=levels(facs))
x

Avec la sortie:

[1] i    want to   be   a   
Levels: a an be factor i integer not to want

Cela ne fonctionnera que si les deux vecteurs ont les mêmes niveaux qu'ici.

6
Aniko

C'est un très mauvais R Gotcha. Dans le même ordre d’idées, en voici un qui vient d’absorber plusieurs heures de mon temps.

x <- factor(c("Yes","Yes","No", "No", "Yes", "No"))
y <- c("Yes", x)

> y
[1] "Yes" "2"   "2"   "1"   "1"   "2"   "1"  
> is.factor(y)
[1] FALSE

Il me semble que la meilleure solution est celle de Richie, qui est contraignante.

> y <- c("Yes", as.character(x))
> y
[1] "Yes" "Yes" "Yes" "No"  "No"  "Yes" "No" 
> y <- as.factor(y)
> y
[1] Yes Yes Yes No  No  Yes No 
Levels: No Yes

Tant que les niveaux sont correctement définis, comme le mentionne Richie.

4
Paul Johson

Depuis que cette question a été posée, Hadley Wickham a créé un package forcats avec une fonction fct_c conçue pour des problèmes tels que celui-ci.

> library(forcats)
>  facs <- as.factor(c("i", "want", "to", "be", "a", "factor", "not", "an", 
"integer"))
> fct_c(facs[1:3], facs[4:5])
[1] i    want to   be   a
Levels: a an be factor i integer not to want

De plus, fct_c n'est pas non plus dupe des concaténations de facteurs qui utilisent des codages numériques divergents:

> x <- as.factor(c('c', 'z'))
> x
[1] c z
Levels: c z
> y <- as.factor(c('a', 'b', 'z'))
> y
[1] a b z
Levels: a b z
> c(x, y)
[1] 1 2 1 2 3
> fct_c(x, y)
[1] c z a b z
Levels: c z a b
> as.numeric(fct_c(x, y))
[1] 1 2 3 4 2
1
Connor Harris

Pour cette raison, je préfère travailler avec des facteurs dans data.frames:

df <- data.frame(facs = as.factor(
      c("i", "want", "to", "be", "a", "factor", "not", "an", "integer") ))

et le sous-ensemble en utilisant subset () ou dplyr :: filter () etc. plutôt que des index de lignes. Comme je n'ai pas de critère de sous-ensemble significatif dans ce cas, je vais simplement utiliser head () et tail ():

df1 <- head(df, 4)
df2 <- tail(df, 2)

Ensuite, vous pouvez les manipuler assez facilement, par exemple:

dfc <- rbind(df1, df2)
dfc$facs
#[1] i       want    to      be      an      integer
#Levels: a an be factor i integer not to want
0
Melkor.cz

Sur la base des autres réponses qui utilisent la conversion en caractère, j'utilise la fonction suivante pour concaténer des facteurs:

concat.factor <- function(...){
  as.factor(do.call(c, lapply(list(...), as.character)))
}

Vous pouvez utiliser cette fonction comme vous utiliseriez c.

0
snaut

Voici un autre moyen d'ajouter à une variable de facteur lorsque la configuration est légèrement différente:

facs <- factor(1:3, levels=1:9,
               labels=c("i", "want", "to", "be", "a", "factor", "not", "an", "integer"))
facs
# [1] i       want    to      be      a       factor  not     an      integer
# Levels: a an be factor i integer not to want
facs[4:6] <- levels(facs)[4:6]
facs
# [1] i      want   to     be     a      factor
# Levels: i want to be a factor not an integer
0
gung