Je voudrais obtenir une liste de tous les jeux de données dans un paquet R particulier montré dans la console. Je sais que la fonction data()
listera tous les jeux de données dans les paquets chargés. Ce n'est pas ma cible. Je veux obtenir la liste de tous les ensembles de données dans un paquet R particulier. La tentative suivante ne fonctionne pas.
data()
data('arules')
# Warning message:
# In data("arules") : data set ‘arules’ not found
Mon autre intention est d’obtenir une liste de dim
pour tous les ensembles de données d’un package particulier.
Il y a quelques bonnes informations à ce sujet dans la section détails de help(data)
. Voici les bases, en utilisant le package plyr comme exemple. Pour commencer, voyons ce qui est disponible dans data()
.
names(data())
#[1] "title" "header" "results" "footer"
Une enquête plus poussée sur ces éléments révélera ce qu’ils contiennent. Ensuite, nous pouvons utiliser les arguments dans data()
puis sous-définir la liste résultante pour trouver les noms des fichiers dans le package.
d <- data(package = "plyr")
## names of data sets in the package
d$results[, "Item"]
# [1] "baseball" "ozone"
## assign it to use later
nm <- d$results[, "Item"]
## call the promised data
data(list = nm, package = "plyr")
## get the dimensions of each data set
lapply(mget(nm), dim)
# $baseball
# [1] 21699 22
#
# $ozone
# [1] 24 24 72
Edition/Mise à jour: Si vous souhaitez trouver les noms des fichiers dans les packages installés all, vous pouvez utiliser les éléments suivants. .packages(TRUE)
donne tous les paquets disponibles dans le chemin d’emplacement de la bibliothèque lib.loc
. Puisque les ensembles de données des packages base et stats ont été déplacés vers le package datasets, nous devons en tenir compte en les supprimant avec setdiff()
.
## names of all packages sans base and stats
pkgs <- setdiff(.packages(TRUE), c("base", "stats"))
## get the names of all the data sets
dsets <- data(package = pkgs)$result[, "Item"]
## look at the first few in our result
head(dsets)
# [1] "AirPassengers" "BJsales" "BJsales.lead (BJsales)"
# [4] "BOD" "CO2" "ChickWeight"
Le paquet vcdExtra a une fonction datasets
rien que pour ça. Il renvoie un bloc de données contenant le nom, la classe, les dimensions et le titre de chaque ensemble de données contenu dans un package.
> vcdExtra::datasets("plyr")
Item class dim Title
1 baseball data.frame 21699x22 Yearly batting records for all major league baseball players
2 ozone array 24x24x72 Monthly ozone measurements over Central America.
>
Cela fonctionne avec plusieurs noms de paquets aussi:
> vcdExtra::datasets(c("plyr", "dplyr"))
Package Item class dim
1 plyr baseball data.frame 21699x22
2 plyr ozone array 24x24x72
3 dplyr nasa tbl_cube 41472x4
Title
1 Yearly batting records for all major league baseball players
2 Monthly ozone measurements over Central America.
3 NASA spatio-temporal data
>
Si vous êtes dans R-studio et que vous avez importé ce paquet
vous pouvez passer d'un environnement global à un package spécifique dans votre fenêtre "environnement"
Ensuite, vous pouvez voir la liste des données dans ce paquet
Si vous souhaitez vérifier la liste de tous les jeux de données, utilisez cette commande.
data()
Si vous souhaitez vérifier les ensembles de données d'un paquet spécifique, par exemple, ggplot2
library(ggplot2)
data(package = "ggplot")