J'ai un cadre de données avec plusieurs colonnes; un chiffre et un caractère. Comment calculer la somme d'une colonne spécifique? J'ai googlé pour cela et je vois de nombreuses fonctions (sum
, cumsum
, rowsum
, rowSums
, colSums
, aggregate
, apply
) mais je ne peux pas tout comprendre.
Par exemple, supposons que j'ai un bloc de données people
avec les colonnes suivantes
Name Height Weight
Mary 65 110
John 70 200
Jane 64 115
…
Comment puis-je obtenir la somme de tous les poids?
Vous pouvez simplement utiliser sum(people$Weight)
.
sum
résume un vecteur et people$Weight
récupère la colonne d'épaisseur à partir de votre bloc de données.
Remarque - vous pouvez obtenir une aide intégrée en utilisant ?sum
, ?colSums
, etc. (par ailleurs, colSums
vous donnera la somme de chaque colonne).
Quand vous avez des valeurs 'NA' dans la colonne, alors
sum(as.numeric(JuneData1$Account.Balance), na.rm = TRUE)
à commander après le colsum:
order(colSums(people),decreasing=TRUE)
si plus de 20 colonnes ou plus
order(colSums(people[,c(5:25)],decreasing=TRUE) ##in case of keeping the first 4 columns remaining.