J'ai un dataframe comme ceci:
id adit diag1 diag2
2 3 4230 2234
3 5 3345 4456
4 6 4567 4467
J'aimerais ajouter 2 autres colonnes, dse1
et dse2
en utilisant le pseudo-code ci-dessous:
if diag1 contains 4230 then dse1 = 1 else dse1 = 0
if diag2 contains 4567 then dse2 =1 else dse2 = 0
J'ai utilisé ceci:
for (i in 1 : nrow(dse)){
for (j in 3: ncol(dse)){
if dse[i,j] %in% ("4320"){dse$dse1 = 1}
else{dse$dse1 = 0}
if dse[i,j] %in% ("4567"){dse$dse2 = 1}
else{dse$dse2 = 0}
}
}
Mais ceux-ci ne fonctionnent pas.
Pas besoin d'utiliser une boucle, utilisez simplement ifelse
, par exemple
dse = within(dse, {
dse1 = ifelse(diag1 == 4230, 1, 0)
dse2 = ifelse(diag2 == 4567, 1, 0)
})
N'utilisez pas le if/else. Aller vectorisé comme dans:
dat$dse1 <- as.numeric(dat$diag1 == 4230)
dat$dse2 <- as.numeric(dat$diag2 == 4567)
Comme ça:
dse$dse1<-0
dse$dse2<-0
dse$dse1[dse$diag1==4230]<-1
dse$dse2[dse$diag2==4567]<-1
Procurez-vous un bon tutoriel R (tel que this ) et lisez tout sur les vecteurs d’index.
Vous pouvez utiliser transform
:
transform(dse, dse1 = as.numeric(diag1 == 4230),
dse2 = as.numeric(diag2 == 4567))
vous pouvez aussi utiliser:
sinon():
dat <- data.frame(id = c(2,3,4), adit = c(3,5,6),diag1 = c(4230,3345,4567), diag2 = c(2234,4567,4467))
dat$dse1 <- ifelse(dat$diag1 == 4230,1,0)
dat$dse2 <- ifelse(dat$diag2 == 4567,1,0)
dat