rbind ne vérifie pas les noms de colonne lors de la liaison de vecteurs:
l = list(row1 = c(10, 20), row2 = c(20, 10))
names(l$row1) = c("A", "B")
names(l$row2) = c("B", "A")
l
$row1
A B
10 20
$row2
B A
20 10
rbind(l$row1, l$row2)
A B
[1,] 10 20
[2,] 20 10
Comment puis-je produire cette matrice à partir d'un certain nombre d'éléments de liste, en s'assurant que les noms des colonnes sont correctement appariés sur les lignes:
A B
[1,] 10 20
[2,] 10 20
Vous pouvez utiliser match
:
l <- list(row1 = setNames(1:3, c("A", "B", "C")),
row2 = setNames(1:3, c("B", "C", "A")),
row3 = setNames(1:3, c("C", "A", "B")))
do.call(rbind, lapply(l, function(x) x[match(names(l[[1]]), names(x))]))
Le résultat:
A B C
row1 1 2 3
row2 3 1 2
row3 2 3 1
smartbind()
correspond aux noms de colonne et tolère les noms manquants:
library(gtools)
do.call(smartbind,l)
A B
row1 10 20
row2 10 20
Il semble que dans les versions actuelles de R (j'ai la version 3.3.0), rbind
a la capacité de joindre deux ensembles de données avec les mêmes colonnes de nom, même s'ils sont dans un ordre différent.
df1 <- data.frame(a = c(1:5), c = c(LETTERS[1:5]),b=c(11:15))
df2 <- data.frame(a = c(6:10), b = c(16:20),c=c(LETTERS[6:10]))
rbind(df1,df2)
a c b
1 1 A 11
2 2 B 12
3 3 C 13
4 4 D 14
5 5 E 15
6 6 F 16
7 7 G 17
8 8 H 18
9 9 I 19
10 10 J 20
rbind
fonctionnera si vous modifiez d'abord chaque élément de l en un bloc de données:
do.call("rbind", lapply(l, function(x) data.frame(as.list(x))))
A B
row1 10 20
row2 10 20
do.call(rbind, lapply(l, function(row) row[order(names(row))]))
Réduire est une fonction puissante, mais parfois peu utilisée. voici une autre implémentation
Cela créera un lien dans lequel, s'il existe des colonnes ne correspondant pas à "NA", elles seront générées.
rbindedFrame = Reduce(custom_rbind,listofDataframes)
custom_rbind = function(x1,x2){
c1 = setdiff(colnames(x1),colnames(x2))
c2 = setdiff(colnames(x2),colnames(x1))
for(c in c2){##Adding missing columns from 2 in 1
x1[[c]]=NA
}
for(c in c1){##Similiarly ading missing from 1 in 2
x2[[c]]=NA
}
x2 = x2[colnames(x1)]
rbind(x1,x2)
}
}
Pourquoi pas simplement rbind(l$row1, l$row2[names(l$row1)])
. Fonctionne également bien pour les trames de données. Notez que cela supprimera les colonnes de l$row2
qui n'apparaissent pas dans l$row1
.