J'utilise le jeu de données mtcars pour illustrer ma question.
Par exemple, je veux créer des sous-ensembles de données sur des voitures 4 cylindres. Je peux faire:
mtcars %>% filter(cyl == 4)
Dans mon travail, je dois passer une variable de chaîne comme nom de colonne. Par exemple:
var <- 'cyl'
mtcars %>% filter(var == 4)
J'ai aussi fait:
mtcars %>% filter(!!var == 4)
Dans les deux cas, j'ai eu dataframe vide.
!!
ou UQ
évalue la variable, donc mtcars %>% filter(!!var == 4)
est identique à mtcars %>% filter('cyl' == 4)
où la condition est toujours évaluée à false; Vous pouvez le prouver en imprimant !!var
dans la fonction de filtrage:
mtcars %>% filter({ print(!!var); (!!var) == 4 })
# [1] "cyl"
# [1] mpg cyl disp hp drat wt qsec vs am gear carb
# <0 rows> (or 0-length row.names)
Pour évaluer var
dans la colonne cyl
, vous devez d'abord convertir var
en un symbole de cyl
, puis évaluer le symbole cyl
en une colonne:
Utiliser rlang
:
library(rlang)
var <- 'cyl'
mtcars %>% filter((!!sym(var)) == 4)
# mpg cyl disp hp drat wt qsec vs am gear carb
#1 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
#2 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
#3 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
# ...
Ou utilisez as.symbol/as.name
de baseR:
mtcars %>% filter((!!as.symbol(var)) == 4)
mtcars %>% filter((!!as.name(var)) == 4)
Je pense que la réponse de @ snoram est élégante et dépend uniquement de dplyr
.
var <- c('cyl')
mtcars %>% filter(get(var) == 4)
Vous pouvez aussi l'utiliser avec une liste. Pour un exemple simple, vous pouvez obtenir le nombre de chaque colonne filtrée en tant que nouvel ensemble de données.
#adding car name
mtcars <- rownames_to_column(mtcars, "car_name")
#name your vectors
vector <- c("vs","am","carb")
df2 <- data.frame()
for (variable in vector) {
df1 <- mtcars %>% filter(get(variable) == 1) %>% summarise(variable = n_distinct(car_name)) %>% data.frame()
df2<- rbind(df2,df1)
}