web-dev-qa-db-fra.com

Obtenir une liste des ensembles de données dans un paquet particulier

Je voudrais obtenir une liste de tous les jeux de données dans un paquet R particulier montré dans la console. Je sais que la fonction data() listera tous les jeux de données dans les paquets chargés. Ce n'est pas ma cible. Je veux obtenir la liste de tous les ensembles de données dans un paquet R particulier. La tentative suivante ne fonctionne pas. 

data()
data('arules')
# Warning message:
# In data("arules") : data set ‘arules’ not found

Mon autre intention est d’obtenir une liste de dim pour tous les ensembles de données d’un package particulier.

27
S Das

Il y a quelques bonnes informations à ce sujet dans la section détails de help(data). Voici les bases, en utilisant le package plyr comme exemple. Pour commencer, voyons ce qui est disponible dans data().

names(data())
#[1] "title"   "header"  "results" "footer" 

Une enquête plus poussée sur ces éléments révélera ce qu’ils contiennent. Ensuite, nous pouvons utiliser les arguments dans data() puis sous-définir la liste résultante pour trouver les noms des fichiers dans le package.

d <- data(package = "plyr")
## names of data sets in the package
d$results[, "Item"]
# [1] "baseball" "ozone"   
## assign it to use later
nm <- d$results[, "Item"]
## call the promised data
data(list = nm, package = "plyr")
## get the dimensions of each data set
lapply(mget(nm), dim)
# $baseball
# [1] 21699    22
#
# $ozone
# [1] 24 24 72

Edition/Mise à jour: Si vous souhaitez trouver les noms des fichiers dans les packages installés all, vous pouvez utiliser les éléments suivants. .packages(TRUE) donne tous les paquets disponibles dans le chemin d’emplacement de la bibliothèque lib.loc. Puisque les ensembles de données des packages base et stats ont été déplacés vers le package datasets, nous devons en tenir compte en les supprimant avec setdiff()

## names of all packages sans base and stats
pkgs <- setdiff(.packages(TRUE), c("base", "stats"))
## get the names of all the data sets
dsets <- data(package = pkgs)$result[, "Item"]
## look at the first few in our result
head(dsets)
# [1] "AirPassengers"          "BJsales"                "BJsales.lead (BJsales)"
# [4] "BOD"                    "CO2"                    "ChickWeight"   
31
Rich Scriven

Le paquet vcdExtra a une fonction datasets rien que pour ça. Il renvoie un bloc de données contenant le nom, la classe, les dimensions et le titre de chaque ensemble de données contenu dans un package.

> vcdExtra::datasets("plyr")
      Item      class      dim                                                        Title
1 baseball data.frame 21699x22 Yearly batting records for all major league baseball players
2    ozone      array 24x24x72             Monthly ozone measurements over Central America.
>

Cela fonctionne avec plusieurs noms de paquets aussi:

> vcdExtra::datasets(c("plyr", "dplyr"))
  Package     Item      class      dim
1    plyr baseball data.frame 21699x22
2    plyr    ozone      array 24x24x72
3   dplyr     nasa   tbl_cube  41472x4
                                                         Title
1 Yearly batting records for all major league baseball players
2             Monthly ozone measurements over Central America.
3                                    NASA spatio-temporal data
>
5
user101089

Si vous êtes dans R-studio et que vous avez importé ce paquet

vous pouvez passer d'un environnement global à un package spécifique dans votre fenêtre "environnement"

Ensuite, vous pouvez voir la liste des données dans ce paquet

0
cloudscomputes

Si vous souhaitez vérifier la liste de tous les jeux de données, utilisez cette commande.

data()

Si vous souhaitez vérifier les ensembles de données d'un paquet spécifique, par exemple, ggplot2

library(ggplot2) data(package = "ggplot")

0
Faizan Ahmed